主权项 |
1.基于心理声学模型的语音后置感知滤波器,其特征在于:在所述滤波器中,1)带噪语音经过连续可导的谱减法增强后,根据心理声学模型分帧计算每帧的掩蔽阈值;2)用第一步求解的掩蔽阈值构建代价函数:J=P(ε<sub>s</sub>)+μ(P(ε<sub>r</sub>)-E[T<sub>k</sub>])=|G-1|<sup>2</sup>E[|S<sub>k</sub>|<sup>2</sup>]+μ(|G|<sup>2</sup>E[|N<sub>k</sub>|<sup>2</sup>]-E[T<sub>k</sub>])其中,ε<sub>s</sub>=S<sub>k</sub>(G-1)为语音失真,ε<sub>r</sub>=N<sub>k</sub>G为残留噪声;E(N<sub>k</sub>S<sub>k</sub>)=0,语音失真的功率P(ε<sub>s</sub>)、残留噪声的功率P(ε<sub>r</sub>);3)通过使代价函数最下,求解感知滤波器的增益;4)再用感知归一化因子对感知滤波器进行修正,感知归一化因子为:<img file="FDA0000464756530000011.GIF" wi="411" he="124" />其中,T<sub>min</sub>(l)为第1帧中的最小值,T<sub>max</sub>(l)为第1帧中的最大值,得到最终的感知滤波器的增益G<sub>k</sub>为:<maths num="0001"><![CDATA[<math><mrow><msub><mi>G</mi><mi>k</mi></msub><mo>=</mo><mn>1</mn><mo>/</mo><mi>max</mi><mrow><mo>(</mo><mi>θ</mi><mo>*</mo><mfrac><msqrt><msup><mrow><mo>|</mo><msub><mi>N</mi><mi>k</mi></msub><mo>|</mo></mrow><mn>2</mn></msup></msqrt><msqrt><msub><mi>T</mi><mi>k</mi></msub></msqrt></mfrac><mo>,</mo><mn>1</mn><mo>)</mo></mrow><mo>=</mo><mn>1</mn><mo>/</mo><mi>max</mi><mrow><mo>(</mo><mi>θ</mi><mo>*</mo><mfrac><mrow><mo>|</mo><msub><mi>N</mi><mi>k</mi></msub><mo>|</mo></mrow><msqrt><msub><mi>T</mi><mi>k</mi></msub></msqrt></mfrac><mo>,</mo><mn>1</mn><mo>)</mo></mrow></mrow></math>]]></maths>5)最后得到增强的语音。 |