发明名称 音频处理方法及其装置
摘要 本发明涉及多媒体技术,公开了一种音频处理方法及其装置。本发明中,通过对左右声道间的频谱进行差异性分析,获得左右声道频谱的归一化能量差异比,根据该归一化能量差异比和用于整形的序列得到增强滤波器系数,根据得到的增强滤波器系数对立体声信号的频谱进行增强滤波。由于在通过合成滤波器将频域信号转换为音频信号之前,先利用增强滤波器在频域完成增强滤波,可大大提高音频处理效果,使得最终输出的音频具有更好的立体声增强或者去除人声的效果。
申请公布号 CN101894559B 申请公布日期 2012.06.06
申请号 CN201010245618.6 申请日期 2010.08.05
申请人 展讯通信(上海)有限公司 发明人 吴晟;林福辉;张本好;李昙;徐晶明
分类号 G10L19/00(2006.01)I;G10L19/02(2006.01)I;G10L21/02(2006.01)I;H04S7/00(2006.01)I 主分类号 G10L19/00(2006.01)I
代理机构 上海明成云知识产权代理有限公司 31232 代理人 成春荣;竺云
主权项 一种音频处理方法,其特征在于,包含以下步骤:在获取到立体声的频域信号后,对左声道频谱XL和右声道频谱XR进行差异性分析,得到左右声道频谱的归一化能量差异比Denergy,其中,所述XL、XR和Denergy均为包含N点的序列,N为所述左声道频谱和右声道频谱分别包含的谱线数;将所述Denergy通过N点的序列αreshape进行整形,得到整形后的序列Sfilter,并将所述Sfilter作为增强滤波器的系数,其中,所述αreshape根据人声所占的频率带宽和音频处理的目的进行设置;利用所述增强滤波器对所述XL和XR分别进行增强滤波;通过以下公式之一计算所述Denergy: <mrow> <msub> <mi>D</mi> <mi>energy</mi> </msub> <mo>[</mo> <mi>k</mi> <mo>]</mo> <mo>=</mo> <mi>max</mi> <mo>[</mo> <msub> <mi>d</mi> <mi>min</mi> </msub> <mo>,</mo> <mi>min</mi> <mrow> <mo>(</mo> <msub> <mi>d</mi> <mi>max</mi> </msub> <mo>,</mo> <mi>&lambda;</mi> <mfrac> <mrow> <msub> <mi>E</mi> <mi>diff</mi> </msub> <mo>[</mo> <mi>k</mi> <mo>]</mo> </mrow> <mrow> <msub> <mi>E</mi> <mi>sum</mi> </msub> <mo>[</mo> <mi>k</mi> <mo>]</mo> </mrow> </mfrac> <mo>)</mo> </mrow> <mo>]</mo> <mo>,</mo> <mi>k</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>,</mo> <mi>N</mi> </mrow> <mrow> <msub> <mi>D</mi> <mi>energy</mi> </msub> <mo>[</mo> <mi>k</mi> <mo>]</mo> <mo>=</mo> <mi>max</mi> <mo>[</mo> <msub> <mi>d</mi> <mi>min</mi> </msub> <mo>,</mo> <mi>&lambda;</mi> <mi>min</mi> <mrow> <mo>(</mo> <msub> <mi>d</mi> <mi>max</mi> </msub> <mo>,</mo> <mfrac> <mrow> <msub> <mi>E</mi> <mi>diff</mi> </msub> <mo>[</mo> <mi>k</mi> <mo>]</mo> </mrow> <mrow> <msub> <mi>E</mi> <mi>sum</mi> </msub> <mo>[</mo> <mi>k</mi> <mo>]</mo> </mrow> </mfrac> <mo>)</mo> </mrow> <mo>]</mo> <mo>,</mo> <mi>k</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>,</mo> <mi>N</mi> </mrow> <mrow> <msub> <mi>D</mi> <mi>energy</mi> </msub> <mo>[</mo> <mi>k</mi> <mo>]</mo> <mo>=</mo> <mi>&lambda;</mi> <mi>max</mi> <mo>[</mo> <msub> <mi>d</mi> <mi>min</mi> </msub> <mo>,</mo> <mi>min</mi> <mrow> <mo>(</mo> <msub> <mi>d</mi> <mi>max</mi> </msub> <mo>,</mo> <mfrac> <mrow> <msub> <mi>E</mi> <mi>diff</mi> </msub> <mo>[</mo> <mi>k</mi> <mo>]</mo> </mrow> <mrow> <msub> <mi>E</mi> <mi>sum</mi> </msub> <mo>[</mo> <mi>k</mi> <mo>]</mo> </mrow> </mfrac> <mo>)</mo> </mrow> <mo>]</mo> <mo>,</mo> <mi>k</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>,</mo> <mi>N</mi> </mrow>其中,k为频谱的序号,所述λ为归一化因子,所述λ为所述XL和所述XR的总和能量E’sum与总差能量E’diff的比值;所述dmax为上限门限值,1≤dmax≤2,所述dmin为下限门限值,0≤dmin≤1,所述Esum和所述Ediff均为包含N点的序列,所述Esum为所述XL和XR的和频谱能量,所述Ediff为所述XL和XR的差频谱能量。
地址 201203 上海市浦东新区张江高科技园区祖冲之路2288弄展讯中心1号楼