发明名称 多功能呼叫分机
摘要 本发明提供了一种多功能呼叫分机,包括主控芯片,还包括各自分别与主控芯片相连接的麦克风、扬声器以及接收模块,所述主控芯片还通过一级缓存连接有判别模块,所述判别模块通过二级缓存连接有发送模块;所述判别模块基于FPGA芯片,所述FPGA芯片内搭建有用于判别无效语音数据片段的BP神经网络。本发明根据语音数据片段的特征信息判别出无效语音数据片段,而后将无效语音数据片段替换为体积极小的空白音数据后再由二级缓存通过发送模块传输至主机,压缩了传输语音数据的大小,降低了呼叫分机对带宽的需求。
申请公布号 CN106297771A 申请公布日期 2017.01.04
申请号 CN201610670271.7 申请日期 2016.08.15
申请人 烟台冰科医疗科技股份有限公司 发明人 曹善江;程志强
分类号 G10L15/02(2006.01)I;G10L15/16(2006.01)I;G10L21/0232(2013.01)I;H04M11/02(2006.01)I 主分类号 G10L15/02(2006.01)I
代理机构 烟台双联专利事务所(普通合伙) 37225 代理人 梁翠荣
主权项 多功能呼叫分机,包括主控芯片,还包括各自分别与主控芯片相连接的麦克风、扬声器以及接收模块,其特征在于:所述主控芯片还通过一级缓存连接有判别模块,所述判别模块通过二级缓存连接有发送模块;所述判别模块基于FPGA芯片,所述FPGA芯片内搭建有用于判别无效语音数据片段的BP神经网络,所述BP神经网络判别无效语音数据片段的方法步骤为:(A)主控芯片将麦克风收录的语音转化为语音数据,将该语音数据中50Hz以下及1200Hz以上的频段全部滤除,再将滤除后的语音数据以3s为单位分割为语音数据序列并将该语音数据序列存放在一级缓存中;主控芯片从一级缓存中依次读取语音数据序列中的元素,分别作如下处理:(A‑1)记该元素的整体平均分贝值为x<sub>1</sub>,、整体码率为x<sub>2</sub>;(A‑2)对该元素进行频域分析,以50Hz为起点,计算每过50Hz分贝值的变化率,记录第一个变化率大于0.1dB/Hz的频率值为x<sub>3</sub>、第一个变化率小于‑0.1dB/Hz的频率值为x<sub>4</sub>;若未找到符合条件的x<sub>3</sub>,则将x<sub>3</sub>设定为50Hz,若未找到符合条件的x<sub>4</sub>,则将x<sub>4</sub>设定为1200Hz;(A‑3)计算x<sub>3</sub>至x<sub>4</sub>频段的平均分贝值为x<sub>5</sub>;(A‑4)将x<sub>1</sub>、x<sub>2</sub>、x<sub>3</sub>、x<sub>4</sub>和x<sub>5</sub>作为一组输入数据存储至一级缓存中;(B)将一级缓存中的各组输入数据依次传送至判别模块的BP神经网络中进行判别;该BP神经网络沿输入至输出方向依次设置有输入层、预处理层、中间层和输出层;所述输入层包括用于输入x<sub>1</sub>的输入单元一、用于输入x<sub>2</sub>的输入单元二、用于输入x<sub>3</sub>的输入单元三、用于输入x<sub>4</sub>的输入单元四和用于输入x<sub>5</sub>的输入单元五;所述预处理层包括预处理单元一、预处理单元二、预处理单元三和预处理单元四;所述中间层包括中间单元一、中间单元二和中间单元三;所述输出层包括输出单元;所述输入层、预处理层、中间层和输出层分别为BP神经网络的第1层、第2层、第3层和第4层;所述输入单元一、输入单元二、输入单元三、输入单元四和输入单元五分别为第1层的第1单元、第2单元、第3单元、第4单元和第5单元;所述预处理单元一、预处理单元二、预处理单元三和预处理单元四分别为第2层的第1单元、第2单元、第3单元和第4单元;所述中间单元一、中间单元二和中间单元三分别为第3层的第1单元、第2单元和第3单元;所述输出单元为第4层的第1单元;设第l层第i单元的输出值为<img file="FDA0001079201330000021.GIF" wi="115" he="92" />偏置项为<img file="FDA0001079201330000022.GIF" wi="117" he="94" />激活函数为<img file="FDA0001079201330000023.GIF" wi="166" he="93" />第l层的单元总数为n<sup>(l)</sup>,第l层第j单元的输出值<img file="FDA0001079201330000024.GIF" wi="91" he="101" />传递至第l+1层第i单元时的权值为<img file="FDA0001079201330000025.GIF" wi="120" he="95" />则对于第1层:<img file="FDA0001079201330000031.GIF" wi="246" he="94" />对于第2至4层:<img file="FDA0001079201330000032.GIF" wi="958" he="111" />设<img file="FDA0001079201330000033.GIF" wi="926" he="89" />和<img file="FDA0001079201330000034.GIF" wi="108" he="88" />恒为0;BP神经网络根据输入的数据判断出该元素是否为无效语音数据片段,若为无效语音数据片段则将该元素替换为空白音数据;(C)判别模块将替换处理过的语音数据序列传送至二级缓存中。
地址 264000 山东省烟台市芝罘区车山路8号