一种强背景噪声下的语音提取方法,申请号CN201310646708.X-传众专利搜索

发明名称	一种强背景噪声下的语音提取方法
摘要	本发明公开了一种强背景噪声下的语音提取方法，首先对含有强背景噪声的原始语音信号进行预离散采样和量化得到数据帧，对数据帧构建基于Morlet小波函数的小波神经网络，对于小波神经网络参数构建粒子群适应度函数，再通过粒子群算法得到最优参数，将数据帧输入小波神经网络进行滤波，从而去除噪声，提取得到语音信号。本发明中采用的小波神经网络的参数是由粒子群算法得到的，因此本发明提供的方法可以提高对不同环境噪声特征的适应度。
申请公布号	CN103617798A	申请公布日期	2014.03.05
申请号	CN201310646708.X	申请日期	2013.12.04
申请人	中国人民解放军成都军区总医院	发明人	周龙甫;呼永河;张超群;李正;郝大鹏;赵明
分类号	G10L21/0208(2013.01)I	主分类号	G10L21/0208(2013.01)I
代理机构	成都行之专利代理事务所(普通合伙) 51220	代理人	温利平
主权项	1.一种强背景噪声下的语音提取方法，其特征在于，包括以下步骤：S1：对含有强背景噪声的原始语音信号进行预处理，包括离散采样和量化，提取P个由M个采样点构成的数据帧f<sup>p</sup>(t<sub>m</sub>)，其中，p＝0,1,…,P表示数据所处的帧号；S2：构建小波神经网络模型，其模型公式为：<maths num="0001"><![CDATA[<math><mrow><mover><msup><msub><mi>f</mi><mi>n</mi></msub><mi>p</mi></msup><mo>^</mo></mover><mo>=</mo><mi>σ</mi><mo>[</mo><munderover><mi>Σ</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>K</mi></munderover><msub><mi>w</mi><mi>nk</mi></msub><mo>[</mo><munderover><mi>Σ</mi><mrow><mi>m</mi><mo>=</mo><mn>1</mn></mrow><mi>M</mi></munderover><msup><mi>f</mi><mi>p</mi></msup><mrow><mo>(</mo><msub><mi>t</mi><mi>m</mi></msub><mo>)</mo></mrow><mi>h</mi><mrow><mo>(</mo><mfrac><mrow><msub><mi>t</mi><mi>m</mi></msub><mo>-</mo><msub><mi>b</mi><mi>k</mi></msub></mrow><msub><mi>a</mi><mi>k</mi></msub></mfrac><mo>)</mo></mrow><mo>]</mo><mo>]</mo></mrow></math>]]></maths>其中，<img file="FDA0000429637420000012.GIF" wi="88" he="107" />为原始语音信号的估计值；n＝1,2,…,N，N为小波神经网络中输出神经元的个数；σ＝1/(1+e<sup>-x</sup>)，x为设置的常数；w<sub>nk</sub>为权重参数，w<sub>nk</sub>的取值范围为0＜w<sub>nk</sub>＜1；k＝1,2,…,K，K为采用的Morlet小波函数<img file="FDA0000429637420000013.GIF" wi="252" he="171" />的个数，a<sub>k</sub>和b<sub>k</sub>分别对应于第k个Morlet小波核函数中的尺度伸缩因子和时间平移因子；S3：构建粒子群适应度函数<img file="FDA0000429637420000014.GIF" wi="780" he="172" />以(w<sub>n1</sub>,…,w<sub>nK</sub>,a<sub>1</sub>,…,a<sub>K</sub>,b<sub>1</sub>,…,b<sub>K</sub>)作为粒子，采用粒子群算法搜索适应度函数的最小值，设置最大搜索迭代次数D；S4：采用步骤S3搜索得到的适应度函数的最小值对应的(w<sub>n1</sub>,…,w<sub>nK</sub>,a<sub>1</sub>,…,a<sub>K</sub>,b<sub>1</sub>,…,b<sub>K</sub>)，将P个数据帧f<sup>p</sup>(t<sub>m</sub>)输入小波神经网络模型进行滤波，得到N个语音估计值<img file="FDA0000429637420000015.GIF" wi="123" he="108" />
地址	610083 四川省成都市外北天回镇