主权项 |
1.一种强背景噪声下的语音提取方法,其特征在于,包括以下步骤:S1:对含有强背景噪声的原始语音信号进行预处理,包括离散采样和量化,提取P个由M个采样点构成的数据帧f<sup>p</sup>(t<sub>m</sub>),其中,p=0,1,…,P表示数据所处的帧号;S2:构建小波神经网络模型,其模型公式为:<maths num="0001"><![CDATA[<math><mrow><mover><msup><msub><mi>f</mi><mi>n</mi></msub><mi>p</mi></msup><mo>^</mo></mover><mo>=</mo><mi>σ</mi><mo>[</mo><munderover><mi>Σ</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>K</mi></munderover><msub><mi>w</mi><mi>nk</mi></msub><mo>[</mo><munderover><mi>Σ</mi><mrow><mi>m</mi><mo>=</mo><mn>1</mn></mrow><mi>M</mi></munderover><msup><mi>f</mi><mi>p</mi></msup><mrow><mo>(</mo><msub><mi>t</mi><mi>m</mi></msub><mo>)</mo></mrow><mi>h</mi><mrow><mo>(</mo><mfrac><mrow><msub><mi>t</mi><mi>m</mi></msub><mo>-</mo><msub><mi>b</mi><mi>k</mi></msub></mrow><msub><mi>a</mi><mi>k</mi></msub></mfrac><mo>)</mo></mrow><mo>]</mo><mo>]</mo></mrow></math>]]></maths>其中,<img file="FDA0000429637420000012.GIF" wi="88" he="107" />为原始语音信号的估计值;n=1,2,…,N,N为小波神经网络中输出神经元的个数;σ=1/(1+e<sup>-x</sup>),x为设置的常数;w<sub>nk</sub>为权重参数,w<sub>nk</sub>的取值范围为0<w<sub>nk</sub><1;k=1,2,…,K,K为采用的Morlet小波函数<img file="FDA0000429637420000013.GIF" wi="252" he="171" />的个数,a<sub>k</sub>和b<sub>k</sub>分别对应于第k个Morlet小波核函数中的尺度伸缩因子和时间平移因子;S3:构建粒子群适应度函数<img file="FDA0000429637420000014.GIF" wi="780" he="172" />以(w<sub>n1</sub>,…,w<sub>nK</sub>,a<sub>1</sub>,…,a<sub>K</sub>,b<sub>1</sub>,…,b<sub>K</sub>)作为粒子,采用粒子群算法搜索适应度函数的最小值,设置最大搜索迭代次数D;S4:采用步骤S3搜索得到的适应度函数的最小值对应的(w<sub>n1</sub>,…,w<sub>nK</sub>,a<sub>1</sub>,…,a<sub>K</sub>,b<sub>1</sub>,…,b<sub>K</sub>),将P个数据帧f<sup>p</sup>(t<sub>m</sub>)输入小波神经网络模型进行滤波,得到N个语音估计值<img file="FDA0000429637420000015.GIF" wi="123" he="108" /> |