发明名称 语音清晰度预测器及其应用
摘要 本申请涉及一种提供语音清晰度预测器值的方法,该语音清晰度预测器值用于当目标语音信号经过算法处理和/或在噪声环境中接收时估算普通听音者理解所述目标语音信号的能力。本申请还涉及在噪声环境中改善听音者对目标语音信号的理解的方法以及对应的设备单元。本申请的目的是提供一种替代的客观清晰度测量方法,例如适于在时频环境中使用的测量方法。本发明可用于例如音频处理系统中、听音系统、助听器系统。
申请公布号 CN102194460A 申请公布日期 2011.09.21
申请号 CN201110062950.3 申请日期 2011.03.11
申请人 奥迪康有限公司 发明人 C·H··塔阿尔;R·亨德里克斯;R·赫斯登斯;U·克耶姆斯;J·延森
分类号 G10L19/04(2006.01)I;G10L19/02(2006.01)I;G10L19/14(2006.01)I 主分类号 G10L19/04(2006.01)I
代理机构 北京金信立方知识产权代理有限公司 11225 代理人 黄威
主权项 一种提供语音清晰度预测器值的方法,该语音清晰度预测器值用于当目标语音信号经过算法处理和/或在噪声环境中接收时估算普通听音者理解所述目标语音信号的能力,该方法包括:a)提供第一信号x(n)的时频表达式xj(m),第一信号x(n)表示多个频带和多个时刻中的目标语音信号,j为频带指数,m为时间指数;b)提供第二信号y(n)的时频表达式yj(m),第二信号y(n)为多个频带和多个时刻中的所述目标语音信号的噪声信号和/或处理过的所述目标语音信号;c)以第一和第二信号或者源自于它们的信号的时频表达式xj*(m)和yj*(m)的形式的分别提供第一和第二清晰度预测输入;d)基于所述第一和第二清晰度预测输入提供时频依赖的中间语音清晰度系数dj(m);e)通过在J个频率指数和M个时间指数上对所述的中间语音清晰度系数dj(m)进行平均运算,计算最终的语音清晰度预测器d;其中,在给定时刻m的语音清晰度系数dj(m)的计算式为 <mrow> <msub> <mi>d</mi> <mi>j</mi> </msub> <mrow> <mo>(</mo> <mi>m</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <munderover> <mi>&Sigma;</mi> <mrow> <mi>n</mi> <mo>=</mo> <mi>N</mi> <mn>1</mn> </mrow> <mrow> <mi>N</mi> <mn>2</mn> </mrow> </munderover> <mrow> <mo>(</mo> <msubsup> <mi>x</mi> <mi>j</mi> <mo>*</mo> </msubsup> <mrow> <mo>(</mo> <mi>n</mi> <mo>)</mo> </mrow> <mo>-</mo> <msub> <mi>r</mi> <msubsup> <mi>x</mi> <mi>j</mi> <mo>*</mo> </msubsup> </msub> <mo>)</mo> </mrow> <mrow> <mo>(</mo> <msubsup> <mi>y</mi> <mi>j</mi> <mo>*</mo> </msubsup> <mrow> <mo>(</mo> <mi>n</mi> <mo>)</mo> </mrow> <mo>-</mo> <msub> <mi>r</mi> <msubsup> <mi>y</mi> <mi>j</mi> <mo>*</mo> </msubsup> </msub> <mo>)</mo> </mrow> </mrow> <msqrt> <munderover> <mi>&Sigma;</mi> <mrow> <mi>n</mi> <mo>=</mo> <mi>N</mi> <mn>1</mn> </mrow> <mrow> <mi>N</mi> <mn>2</mn> </mrow> </munderover> <msup> <mrow> <mo>(</mo> <msubsup> <mi>x</mi> <mi>j</mi> <mo>*</mo> </msubsup> <mrow> <mo>(</mo> <mi>n</mi> <mo>)</mo> </mrow> <mo>-</mo> <msub> <mi>r</mi> <msubsup> <mi>x</mi> <mi>j</mi> <mo>*</mo> </msubsup> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <munderover> <mi>&Sigma;</mi> <mrow> <mi>n</mi> <mo>=</mo> <mi>N</mi> <mn>1</mn> </mrow> <mrow> <mi>N</mi> <mn>2</mn> </mrow> </munderover> <msup> <mrow> <mo>(</mo> <msubsup> <mi>y</mi> <mi>j</mi> <mo>*</mo> </msubsup> <mrow> <mo>(</mo> <mi>n</mi> <mo>)</mo> </mrow> <mo>-</mo> <msub> <mi>r</mi> <msubsup> <mi>y</mi> <mi>j</mi> <mo>*</mo> </msubsup> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> </msqrt> </mfrac> </mrow>其中xj*(n)和yj*(n)分别为第一和第二清晰度预测输入在时刻n的第j个时频单元的有效幅值,并且其中N1≤m≤N2,且rx*j和ry*j为常数。
地址 丹麦斯门乌姆