发明名称 基于分数傅里叶变换的二维维纳滤波的取证语音增强方法
摘要 本发明公布了一种基于分数傅里叶变换的二维维纳滤波的取证语音增强方法,包括以下步骤:(1)分数傅里叶变换域;(2)取模;(3)加二维汉明窗;(4)二维维纳滤波;(5)分数傅里叶逆变换;(6)线性合并。本发明在取证语音增强领域具有较高的应用价值和广阔的应用前景。
申请公布号 CN101950563A 申请公布日期 2011.01.19
申请号 CN201010259828.0 申请日期 2010.08.20
申请人 东南大学 发明人 包永强;邹采荣;赵力;奚吉;王开;魏昕;唐加能
分类号 G10L21/02(2006.01)I 主分类号 G10L21/02(2006.01)I
代理机构 南京经纬专利商标代理有限公司 32200 代理人 许方
主权项 1.一种基于分数傅里叶变换的二维维纳滤波的取证语音增强方法,其特征在于包括以下步骤:(1)分数傅里叶变换域输入语音序列s(n)的a<sub>i</sub>阶分数傅里叶变换算法如下:<maths num="0001"><![CDATA[<math><mrow><msub><mi>S</mi><msub><mi>a</mi><mi>i</mi></msub></msub><mrow><mo>(</mo><mi>u</mi><mo>)</mo></mrow><mo>=</mo><msup><mi>F</mi><msub><mi>a</mi><mi>i</mi></msub></msup><mrow><mo>(</mo><mi>s</mi><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>)</mo></mrow></mrow></math>]]></maths><maths num="0002"><![CDATA[<math><mrow><mo>=</mo><mfenced open='{' close=''><mtable><mtr><mtd><msqrt><mfrac><mrow><mn>1</mn><mo>-</mo><mi>j</mi><mi>cot</mi><msub><mi>a</mi><mi>i</mi></msub></mrow><mrow><mn>2</mn><mi>&pi;</mi></mrow></mfrac></msqrt><munderover><mo>&Integral;</mo><mrow><mo>-</mo><mo>&infin;</mo></mrow><mrow><mo>+</mo><mo>&infin;</mo></mrow></munderover><mi>exp</mi><mrow><mo>(</mo><mi>j</mi><mfrac><mrow><msup><mi>u</mi><mn>2</mn></msup><mo>+</mo><msup><mi>n</mi><mn>2</mn></msup></mrow><mn>2</mn></mfrac><mi>cot</mi><mi>a</mi><mo>-</mo><mfrac><mi>jun</mi><mrow><mi>sin</mi><msub><mi>a</mi><mi>i</mi></msub></mrow></mfrac><mo>)</mo></mrow><mi>s</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mi>dt</mi></mtd><mtd><msub><mi>a</mi><mi>i</mi></msub><mo>&NotEqual;</mo><mi>m&pi;</mi></mtd></mtr><mtr><mtd><mi>s</mi><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow></mtd><mtd><msub><mi>a</mi><mi>i</mi></msub><mo>=</mo><mn>2</mn><mi>m&pi;</mi></mtd></mtr><mtr><mtd><mi>s</mi><mrow><mo>(</mo><mo>-</mo><mi>n</mi><mo>)</mo></mrow></mtd><mtd><msub><mi>a</mi><mi>i</mi></msub><mo>=</mo><mrow><mo>(</mo><mn>2</mn><mi>m</mi><mo>&PlusMinus;</mo><mn>1</mn><mo>)</mo></mrow><mi>&pi;</mi></mtd></mtr></mtable></mfenced></mrow></math>]]></maths>式中,<img file="FSA00000239174200013.GIF" wi="186" he="96" />O<|p|<2,i=l,2,...,16,m为整数,j为虚数单位;(2)取模<img file="FSA00000239174200014.GIF" wi="222" he="61" />为<img file="FSA00000239174200015.GIF" wi="120" he="56" />的实部,<img file="FSA00000239174200016.GIF" wi="209" he="57" />为<img file="FSA00000239174200017.GIF" wi="121" he="57" />的虚部,<img file="FSA00000239174200018.GIF" wi="121" he="57" />的模如下:<maths num="0003"><![CDATA[<math><mrow><mo>|</mo><msub><mi>S</mi><msub><mi>a</mi><mi>i</mi></msub></msub><mrow><mo>(</mo><mi>u</mi><mo>)</mo></mrow><mo>|</mo><mo>=</mo><msqrt><msup><mrow><mo>(</mo><mi>Re</mi><mrow><mo>(</mo><msub><mi>S</mi><msub><mi>a</mi><mi>i</mi></msub></msub><mrow><mo>(</mo><mi>u</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>)</mo></mrow><mn>2</mn></msup><mo>+</mo><msup><mrow><mo>(</mo><mi>Im</mi><mrow><mo>(</mo><msub><mi>S</mi><msub><mi>a</mi><mi>i</mi></msub></msub><mrow><mo>(</mo><mi>u</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>)</mo></mrow><mn>2</mn></msup></msqrt><mo>;</mo></mrow></math>]]></maths>(3)二维汉明窗二维汉明窗h(l,k):<maths num="0004"><![CDATA[<math><mrow><mi>h</mi><mrow><mo>(</mo><mi>l</mi><mo>,</mo><mi>k</mi><mo>)</mo></mrow><mo>=</mo><mrow><mo>(</mo><mn>0.54</mn><mo>-</mo><mn>0.46</mn><mi>cos</mi><mrow><mo>(</mo><mfrac><mrow><mn>2</mn><mi>&pi;l</mi></mrow><mn>255</mn></mfrac><mo>)</mo></mrow><mo>)</mo></mrow><mrow><mo>(</mo><mn>0.54</mn><mo>-</mo><mn>0.46</mn><mi>cos</mi><mrow><mo>(</mo><mfrac><mrow><mn>2</mn><mi>&pi;k</mi></mrow><mn>15</mn></mfrac><mo>)</mo></mrow><mo>)</mo></mrow><mo>,</mo></mrow></math>]]></maths>上式中l∈[0,255],k∈[0,15];(4)二维维纳滤波<maths num="0005"><![CDATA[<math><mrow><msup><mrow><mo>|</mo><mover><mi>S</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup><mo>=</mo><msup><mrow><mo>|</mo><mi>X</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup><mo>-</mo><msup><mrow><mo>|</mo><mover><mi>N</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup><mo>=</mo><msup><mrow><mo>|</mo><mi>X</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup><mrow><mo>(</mo><mn>1</mn><mo>-</mo><mfrac><msup><mrow><mo>|</mo><mover><mi>N</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup><msup><mrow><mo>|</mo><mi>X</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup></mfrac><mo>)</mo></mrow><mo>,</mo></mrow></math>]]></maths>其中<img file="FSA000002391742000112.GIF" wi="158" he="62" />为目标信号谱的估计幅度,|X(i,j)|为滤波前的目标信号谱的幅度,<img file="FSA000002391742000113.GIF" wi="169" he="75" />噪声信号谱的估计幅度;则可得二维维纳滤波如下:<maths num="0006"><![CDATA[<math><mrow><mover><mi>S</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>=</mo><mi>X</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mi>H</mi><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>,</mo></mrow></math>]]></maths><maths num="0007"><![CDATA[<math><mrow><mo>=</mo><mi>X</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><msqrt><mi>max</mi><mrow><mo>(</mo><mn>1</mn><mo>-</mo><mfrac><mn>1</mn><mrow><mi>SNR</mi><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow></mrow></mfrac><mo>,</mo><mi>&beta;</mi><mo>)</mo></mrow></msqrt><mo>,</mo></mrow></math>]]></maths>上式中β≥0,以保证传输函数H(u,v)>0,<maths num="0008"><![CDATA[<math><mrow><mi>SNR</mi><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>=</mo><mfrac><msup><mrow><mo>|</mo><mover><mi>X</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup><msup><mrow><mo>|</mo><mover><mi>N</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup></mfrac><mo>,</mo></mrow></math>]]></maths>上式中:<maths num="0009"><![CDATA[<math><mrow><mo>|</mo><mover><mi>X</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>|</mo><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mi>v</mi><mo>-</mo><mn>1</mn></mrow><mrow><mi>v</mi><mo>+</mo><mn>1</mn></mrow></munderover><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mi>u</mi><mo>-</mo><mn>1</mn></mrow><mrow><mi>j</mi><mo>=</mo><mi>u</mi><mo>+</mo><mn>1</mn></mrow></munderover><mo>|</mo><mi>X</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo><mo>,</mo></mrow></math>]]></maths><maths num="0010"><![CDATA[<math><mrow><mo>|</mo><mover><mi>N</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>|</mo><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mi>v</mi><mo>-</mo><mn>1</mn></mrow><mrow><mi>v</mi><mo>+</mo><mn>1</mn></mrow></munderover><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mi>u</mi><mo>-</mo><mn>1</mn></mrow><mrow><mi>j</mi><mo>=</mo><mi>u</mi><mo>+</mo><mn>1</mn></mrow></munderover><mo>|</mo><mi>N</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo><mo>;</mo></mrow></math>]]></maths>(5)分数傅里叶逆变换<img file="FSA00000239174200025.GIF" wi="111" he="67" />为a<sub>i</sub>阶分数傅里叶变换域上的估计语音:<img file="FSA00000239174200026.GIF" wi="621" he="69" /><img file="FSA00000239174200027.GIF" wi="801" he="54" />=S<sub>i</sub>(u)exp(-jΔθ<sub>i</sub>(u)),上式中<img file="FSA00000239174200028.GIF" wi="179" he="52" /><img file="FSA00000239174200029.GIF" wi="150" he="52" />分别为a<sub>i</sub>阶分数傅里叶变换域上含噪语音、纯净语音的相位谱,Δθ<sub>i</sub>(u)为相位误差;Δθ<sub>i</sub>(u)=ε<sub>i</sub>u/sina<sub>i</sub>,ε<sub>i</sub>为均值较小的随机变量,则有:<maths num="0011"><![CDATA[<math><mrow><msub><mover><mi>S</mi><mo>^</mo></mover><mi>i</mi></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>=</mo><msup><mi>F</mi><mrow><mo>-</mo><msub><mi>a</mi><mi>i</mi></msub></mrow></msup><mo>[</mo><msub><mi>S</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>u</mi><mo>)</mo></mrow><mi>exp</mi><mrow><mo>(</mo><mo>-</mo><mi>j</mi><msub><mi>&epsiv;</mi><mi>i</mi></msub><mi>u</mi><mo>)</mo></mrow><mo>]</mo></mrow></math>]]></maths><maths num="0012"><![CDATA[<math><mrow><mo>=</mo><msqrt><mfrac><mrow><mn>1</mn><mo>+</mo><mi>j</mi><mi>cot</mi><msub><mi>a</mi><mi>i</mi></msub></mrow><mrow><mn>2</mn><mi>&pi;</mi></mrow></mfrac></msqrt><munderover><mo>&Integral;</mo><mrow><mo>-</mo><mo>&infin;</mo></mrow><mrow><mo>+</mo><mo>&infin;</mo></mrow></munderover><mi>exp</mi><mrow><mo>(</mo><mi>j</mi><mfrac><mrow><mrow><mo>(</mo><msup><mi>u</mi><mn>2</mn></msup><mo>+</mo><msup><mi>n</mi><mn>2</mn></msup><mo>)</mo></mrow><mi>cos</mi><msub><mi>a</mi><mi>i</mi></msub><mo>-</mo><mn>2</mn><mi>u</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><msub><mi>&epsiv;</mi><mi>i</mi></msub><mo>)</mo></mrow></mrow><mrow><mo>-</mo><mn>2</mn><mi>sin</mi><msub><mi>a</mi><mi>i</mi></msub></mrow></mfrac><mo>)</mo></mrow><msub><mi>S</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>u</mi><mo>)</mo></mrow><mi>du</mi><mo>,</mo></mrow></math>]]></maths><img file="FSA000002391742000212.GIF" wi="89" he="56" />为<img file="FSA000002391742000213.GIF" wi="111" he="69" />的时域形式;(6)线性合并令n′=n-ε<sub>i</sub>,代入上式并化简整理可得:<maths num="0013"><![CDATA[<math><mrow><msub><mover><mi>S</mi><mo>^</mo></mover><mi>i</mi></msub><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>=</mo><mi>RES</mi><mrow><mo>(</mo><mi>exp</mi><mrow><mo>(</mo><mo>-</mo><mi>j</mi><mfrac><mrow><msup><msub><mi>&epsiv;</mi><mi>i</mi></msub><mn>2</mn></msup><msup><mi>cos</mi><mn>2</mn></msup><msub><mi>a</mi><mi>i</mi></msub><mo>+</mo><mn>2</mn><msub><mi>&epsiv;</mi><mi>i</mi></msub><mi>t</mi><mi>cos</mi><msub><mi>a</mi><mi>i</mi></msub></mrow><mrow><mn>2</mn><mi>sin</mi><msub><mi>a</mi><mi>i</mi></msub></mrow></mfrac><mo>)</mo></mrow><mo>)</mo></mrow><mi>s</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><msub><mi>&epsiv;</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>,</mo></mrow></math>]]></maths>由于ε<sub>i</sub>为均值较小的随机变量,则有:<maths num="0014"><![CDATA[<math><mrow><msub><mover><mi>S</mi><mo>^</mo></mover><mi>i</mi></msub><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>&ap;</mo><mi>s</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><msub><mi>&epsiv;</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>,</mo></mrow></math>]]></maths>那么线性合并后可得:<maths num="0015"><![CDATA[<math><mrow><mover><mi>s</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mn>1</mn><mi>M</mi></mfrac><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>M</mi></munderover><mo>[</mo><mi>s</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><msub><mi>&epsiv;</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>]</mo><mo>,</mo></mrow></math>]]></maths>当信号路数M→∞时,则有:<maths num="0016"><![CDATA[<math><mrow><mover><mi>s</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>=</mo><mi>E</mi><mo>[</mo><mi>s</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><msub><mi>&epsiv;</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>]</mo><mo>,</mo></mrow></math>]]></maths>由于语音信号为短时平稳随机过程,则有:<maths num="0017"><![CDATA[<math><mrow><mover><mi>s</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>=</mo><mi>s</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><msub><mi>&tau;</mi><mn>0</mn></msub><mo>)</mo></mrow><mo>,</mo></mrow></math>]]></maths>式中τ<sub>0</sub>为时延常数。
地址 215123 江苏省苏州市工业园区独墅湖高教区林泉街399号