发明名称 基于心理声学模型的语音后置感知滤波器
摘要 本发明涉及基于心理声学模型的语音后置感知滤波器,首先,该感知滤波器不需要融合在各个算法中,因而不会影响算法的复杂度,但是却获得了同样增强听觉感知度的效果。其次,它只是针对增强语音的再次处理的过程,使得增强语音的听觉感知度进一步的提高,即使噪声存在,信噪比没有提高的情况下,利用这个后置的感知滤波器,也能达到提高听觉感知度的目的;该后置感知滤波器是建立在语音信号失真最小的情况下使残留噪声尽可能不被人耳听到的条件下,且滤波器的增益是由在该条件下构建含有掩蔽阈值的代价函数获得,并由掩蔽阈值构建的感知归一化因子进一步优化,目的是避免了过度的削弱信号,保证了增强后语音感知失真最小。
申请公布号 CN103824562A 申请公布日期 2014.05.28
申请号 CN201410046572.3 申请日期 2014.02.10
申请人 太原理工大学 发明人 贾海蓉;李鸿燕;武奕峰;张雪英
分类号 G10L21/0208(2013.01)I 主分类号 G10L21/0208(2013.01)I
代理机构 北京方圆嘉禾知识产权代理有限公司 11385 代理人 董芙蓉
主权项 1.基于心理声学模型的语音后置感知滤波器,其特征在于:在所述滤波器中,1)带噪语音经过连续可导的谱减法增强后,根据心理声学模型分帧计算每帧的掩蔽阈值;2)用第一步求解的掩蔽阈值构建代价函数:J=P(ε<sub>s</sub>)+μ(P(ε<sub>r</sub>)-E[T<sub>k</sub>])=|G-1|<sup>2</sup>E[|S<sub>k</sub>|<sup>2</sup>]+μ(|G|<sup>2</sup>E[|N<sub>k</sub>|<sup>2</sup>]-E[T<sub>k</sub>])其中,ε<sub>s</sub>=S<sub>k</sub>(G-1)为语音失真,ε<sub>r</sub>=N<sub>k</sub>G为残留噪声;E(N<sub>k</sub>S<sub>k</sub>)=0,语音失真的功率P(ε<sub>s</sub>)、残留噪声的功率P(ε<sub>r</sub>);3)通过使代价函数最下,求解感知滤波器的增益;4)再用感知归一化因子对感知滤波器进行修正,感知归一化因子为:<img file="FDA0000464756530000011.GIF" wi="411" he="124" />其中,T<sub>min</sub>(l)为第1帧中的最小值,T<sub>max</sub>(l)为第1帧中的最大值,得到最终的感知滤波器的增益G<sub>k</sub>为:<maths num="0001"><![CDATA[<math><mrow><msub><mi>G</mi><mi>k</mi></msub><mo>=</mo><mn>1</mn><mo>/</mo><mi>max</mi><mrow><mo>(</mo><mi>&theta;</mi><mo>*</mo><mfrac><msqrt><msup><mrow><mo>|</mo><msub><mi>N</mi><mi>k</mi></msub><mo>|</mo></mrow><mn>2</mn></msup></msqrt><msqrt><msub><mi>T</mi><mi>k</mi></msub></msqrt></mfrac><mo>,</mo><mn>1</mn><mo>)</mo></mrow><mo>=</mo><mn>1</mn><mo>/</mo><mi>max</mi><mrow><mo>(</mo><mi>&theta;</mi><mo>*</mo><mfrac><mrow><mo>|</mo><msub><mi>N</mi><mi>k</mi></msub><mo>|</mo></mrow><msqrt><msub><mi>T</mi><mi>k</mi></msub></msqrt></mfrac><mo>,</mo><mn>1</mn><mo>)</mo></mrow></mrow></math>]]></maths>5)最后得到增强的语音。
地址 030024 山西省太原市迎泽西大街79号
您可能感兴趣的专利