发明名称 有效内容分类及响度估计
摘要 有效内容分类及响度估计。本文献涉及用于对音频信号进行编码的方法及系统。该方法包括确定音频信号的频谱表示。确定频谱表示步骤可以包括确定音频信号的改进型离散余弦变换(MDCT)系数或正交镜像滤波器(QMF)滤波器组表示。所述方法还包括:使用所确定频谱表示来对音频信号进行编码;基于所确定频谱表示将音频信号的部分分类成话音或非话音。最终,基于所述话音部分来确定音频信号的响度度量。
申请公布号 CN103582913B 申请公布日期 2016.05.11
申请号 CN201280020099.0 申请日期 2012.04.27
申请人 杜比国际公司 发明人 哈拉尔德·蒙特;阿里希特·比斯瓦斯;罗尔夫·迈斯纳
分类号 G10L19/16(2013.01)I;G10L19/24(2013.01)I;G10L25/78(2013.01)I 主分类号 G10L19/16(2013.01)I
代理机构 北京集佳知识产权代理有限公司 11227 代理人 朱胜;李春晖
主权项 一种确定用于音频信号的响度度量的方法,所述方法包括:确定所述音频信号的频谱表示,确定频谱表示包括确定改进型离散余弦变换MDCT系数;根据所述MDCT系数确定伪频谱,其中确定所述伪频谱包括:对于特定频率格m中的特定MDCT系数X<sub>m</sub>,确定伪频谱的相应系数Y<sub>m</sub>为:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>Y</mi><mi>m</mi></msub><mo>=</mo><msup><mrow><mo>(</mo><msubsup><mi>X</mi><mi>m</mi><mn>2</mn></msubsup><mo>+</mo><msup><mrow><mo>(</mo><mrow><msub><mi>X</mi><mrow><mi>m</mi><mo>-</mo><mn>1</mn></mrow></msub><mo>-</mo><msub><mi>X</mi><mrow><mi>m</mi><mo>+</mo><mn>1</mn></mrow></msub></mrow><mo>)</mo></mrow><mn>2</mn></msup><mo>)</mo></mrow><mfrac><mn>1</mn><mn>2</mn></mfrac></msup></mrow>]]></math><img file="FDA0000850769800000011.GIF" wi="921" he="91" /></maths>其中X<sub>m‑1</sub>和X<sub>m+1</sub>分别是与所述特定频率格m相邻的频率格m‑1和频率格m+1中的MDCT系数;至少部分地基于所确定的伪频谱的值,将所述音频信号的部分分类成话音或非话音;以及基于所述话音部分,确定用于所述音频信号的响度度量。
地址 荷兰祖伊杜斯特