主权项 |
一种音频处理方法,其特征在于,包含以下步骤:在获取到立体声的频域信号后,对左声道频谱XL和右声道频谱XR进行差异性分析,得到左右声道频谱的归一化能量差异比Denergy,其中,所述XL、XR和Denergy均为包含N点的序列,N为所述左声道频谱和右声道频谱分别包含的谱线数;将所述Denergy通过N点的序列αreshape进行整形,得到整形后的序列Sfilter,并将所述Sfilter作为增强滤波器的系数,其中,所述αreshape根据人声所占的频率带宽和音频处理的目的进行设置;利用所述增强滤波器对所述XL和XR分别进行增强滤波;通过以下公式之一计算所述Denergy: <mrow> <msub> <mi>D</mi> <mi>energy</mi> </msub> <mo>[</mo> <mi>k</mi> <mo>]</mo> <mo>=</mo> <mi>max</mi> <mo>[</mo> <msub> <mi>d</mi> <mi>min</mi> </msub> <mo>,</mo> <mi>min</mi> <mrow> <mo>(</mo> <msub> <mi>d</mi> <mi>max</mi> </msub> <mo>,</mo> <mi>λ</mi> <mfrac> <mrow> <msub> <mi>E</mi> <mi>diff</mi> </msub> <mo>[</mo> <mi>k</mi> <mo>]</mo> </mrow> <mrow> <msub> <mi>E</mi> <mi>sum</mi> </msub> <mo>[</mo> <mi>k</mi> <mo>]</mo> </mrow> </mfrac> <mo>)</mo> </mrow> <mo>]</mo> <mo>,</mo> <mi>k</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>,</mo> <mi>N</mi> </mrow> <mrow> <msub> <mi>D</mi> <mi>energy</mi> </msub> <mo>[</mo> <mi>k</mi> <mo>]</mo> <mo>=</mo> <mi>max</mi> <mo>[</mo> <msub> <mi>d</mi> <mi>min</mi> </msub> <mo>,</mo> <mi>λ</mi> <mi>min</mi> <mrow> <mo>(</mo> <msub> <mi>d</mi> <mi>max</mi> </msub> <mo>,</mo> <mfrac> <mrow> <msub> <mi>E</mi> <mi>diff</mi> </msub> <mo>[</mo> <mi>k</mi> <mo>]</mo> </mrow> <mrow> <msub> <mi>E</mi> <mi>sum</mi> </msub> <mo>[</mo> <mi>k</mi> <mo>]</mo> </mrow> </mfrac> <mo>)</mo> </mrow> <mo>]</mo> <mo>,</mo> <mi>k</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>,</mo> <mi>N</mi> </mrow> <mrow> <msub> <mi>D</mi> <mi>energy</mi> </msub> <mo>[</mo> <mi>k</mi> <mo>]</mo> <mo>=</mo> <mi>λ</mi> <mi>max</mi> <mo>[</mo> <msub> <mi>d</mi> <mi>min</mi> </msub> <mo>,</mo> <mi>min</mi> <mrow> <mo>(</mo> <msub> <mi>d</mi> <mi>max</mi> </msub> <mo>,</mo> <mfrac> <mrow> <msub> <mi>E</mi> <mi>diff</mi> </msub> <mo>[</mo> <mi>k</mi> <mo>]</mo> </mrow> <mrow> <msub> <mi>E</mi> <mi>sum</mi> </msub> <mo>[</mo> <mi>k</mi> <mo>]</mo> </mrow> </mfrac> <mo>)</mo> </mrow> <mo>]</mo> <mo>,</mo> <mi>k</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>,</mo> <mi>N</mi> </mrow>其中,k为频谱的序号,所述λ为归一化因子,所述λ为所述XL和所述XR的总和能量E’sum与总差能量E’diff的比值;所述dmax为上限门限值,1≤dmax≤2,所述dmin为下限门限值,0≤dmin≤1,所述Esum和所述Ediff均为包含N点的序列,所述Esum为所述XL和XR的和频谱能量,所述Ediff为所述XL和XR的差频谱能量。 |