发明名称 一种采样率差异估计与校正系统及其处理方法
摘要 本发明提供一种采样率差异估计与校正系统及其处理方法。该系统包括采样率差异估计模块和采样率校正模块。首先通过采样率差异估计模块,利用改进的相位变换算法IPHAT,求两路信号的互相关函数;然后,计算它们之间的整数点采样率差异;接着进一步采用基于sinc函数内插的方法,获得分数阶的采样率差异;将整数点的采样率差异与分数阶采样率差异相加,即得到两路信号之间的更为精确的采样率差异值;在计算出两路信号之间的采样率差异以后,通过采样率校正模块,利用抽取和内插滤波器对其中一路信号进行重采样校正。该方法可解决ANC/BSS等多通道信号处理算法在实际应用中存在的由于设备或者环境的原因导致标称为同一采样率的多通道信号出现采样率不一致的问题。
申请公布号 CN101645273B 申请公布日期 2012.02.01
申请号 CN200910088731.5 申请日期 2009.07.10
申请人 中国科学院声学研究所;北京中科信利技术有限公司 发明人 付强;颜永红;覃波
分类号 G10L21/02(2006.01)I 主分类号 G10L21/02(2006.01)I
代理机构 北京法思腾知识产权代理有限公司 11318 代理人 杨小蓉
主权项 1.一种采样率差异估计与校正系统,其特征在于,包括:采样率差异估计模块和采样率校正模块,所述采样率差异估计模块,用于通过改进的相位变换算法IPHAT以及sinc核函数内插的精细方法估计两路相关语音信号之间的采样率差异;所述采样率校正模块,用于对两路存在采样率差异的相关语音信号进行调整,利用抽取和内插滤波器进行重采样校正,使得它们具有一致的采样率,该采样率差异估计与校正系统,首先利用所述采样率差异估计模块,对两路相关语音信号之间的采样率差异进行估计,然后利用所述采样率校正模块,将两路语音信号的采样率调整为一致,所述采样率差异估计模块,是基于相关性原理,计算语音信号之间的互相关函数时,采取一种改进的相位变换算法IPHAT,其具体过程如下:X<sub>1</sub>(w)=FFT(x(n))X<sub>2</sub>(w)=FFT(y(n))<maths num="0001"><![CDATA[<math><mrow><msub><mi>G</mi><mn>12</mn></msub><mrow><mo>(</mo><mi>w</mi><mo>)</mo></mrow><mo>=</mo><msub><mi>X</mi><mn>1</mn></msub><mrow><mo>(</mo><mi>w</mi><mo>)</mo></mrow><msubsup><mi>X</mi><mn>2</mn><mo>*</mo></msubsup><mrow><mo>(</mo><mi>w</mi><mo>)</mo></mrow></mrow></math>]]></maths><maths num="0002"><![CDATA[<math><mrow><msub><mi>R</mi><mn>12</mn></msub><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mn>1</mn><mrow><mn>2</mn><mi>&pi;</mi></mrow></mfrac><munderover><mo>&Integral;</mo><mrow><mo>-</mo><mo>&infin;</mo></mrow><mrow><mo>+</mo><mo>&infin;</mo></mrow></munderover><mfrac><mrow><msub><mi>G</mi><mn>12</mn></msub><mrow><mo>(</mo><mi>w</mi><mo>)</mo></mrow></mrow><msup><mrow><mo>|</mo><msub><mi>G</mi><mn>12</mn></msub><mrow><mo>(</mo><mi>w</mi><mo>)</mo></mrow><mo>|</mo></mrow><mi>&lambda;</mi></msup></mfrac><msup><mi>e</mi><mi>jwn</mi></msup><mi>dw</mi></mrow></math>]]></maths>其中,x(n),y(n)是等长的两路相关语音信号,X<sub>1</sub>(w),X<sub>2</sub>(w)是对应的频谱,G<sub>12</sub>(w)是对应的互相关功率谱,σ代表语音信号的信噪比,λ是与信噪比σ对应的一个比例因子,它们之间满足如下的关系:<maths num="0003"><![CDATA[<math><mrow><mi>&lambda;</mi><mo>=</mo><mfenced open='{' close=''><mtable><mtr><mtd><msub><mi>&lambda;</mi><mn>0</mn></msub></mtd><mtd><mi>&sigma;</mi><mo>&lt;</mo><msub><mi>&sigma;</mi><mn>0</mn></msub></mtd></mtr><mtr><mtd><mfrac><mrow><msub><mi>&lambda;</mi><mn>1</mn></msub><mo>-</mo><msub><mi>&lambda;</mi><mn>0</mn></msub></mrow><mrow><msub><mi>&sigma;</mi><mn>1</mn></msub><mo>-</mo><msub><mi>&sigma;</mi><mn>0</mn></msub></mrow></mfrac><mrow><mo>(</mo><mi>&sigma;</mi><mo>-</mo><msub><mi>&sigma;</mi><mn>1</mn></msub><mo>)</mo></mrow><mo>+</mo><msub><mi>&lambda;</mi><mn>1</mn></msub></mtd><mtd><msub><mi>&sigma;</mi><mn>0</mn></msub><mo>&lt;</mo><mi>&sigma;</mi><mo>&lt;</mo><msub><mi>&sigma;</mi><mn>1</mn></msub></mtd></mtr><mtr><mtd><msub><mi>&lambda;</mi><mn>0</mn></msub></mtd><mtd><mi>&sigma;</mi><mo>></mo><msub><mi>&sigma;</mi><mn>1</mn></msub></mtd></mtr></mtable></mfenced><mo>;</mo></mrow></math>]]></maths>所述采样率差异估计模块,在利用IPHAT算法计算出x(n)与y(n)的互相关函数R<sub>12</sub>(n)以后,由下面的过程计算x(n)与y(n)之间的整数点采样率差异Δf_int:将Δf从-f<sub>M</sub>变化取值到f<sub>M</sub>,每次变化步长为1,对于每一个Δf,计算如下的四个公式,f=f<sub>s</sub>+Δf;x<sub>1</sub>=resample(x,f,f<sub>s</sub>);R<sub>xy</sub>=xcorr(x<sub>1</sub>,y);d(Δf+f<sub>M</sub>+1)=max(R<sub>xy</sub>);由Δf的变化循环,得到序列d;找出序列d的最大值max_value,以及该序列d中的最大值对应的坐标index;整数点采样率差异Δf_int由Δf_int=index-f<sub>M</sub>-1计算出;其中,f<sub>M</sub>是采样率差异估计的范围,f<sub>s</sub>是两路语音信号标称的采样率,resample是重采样函数,表示将语音信号x的采样率调整f<sub>s</sub>/f倍,xcorr是互相关运算函数,max是取最大值函数;在求出整数点采样率差异之后,采用基于sinc核函数内插的方法进一步确定两路语音信号之间的采样率差异,对IPHAT算法求出的一系列R<sub>12</sub>(n)的最大值进行连续时间域的重构,通过找出重构信号的最大值,从而确定更精确的最大值坐标,来找到分数阶采样率差异,计算公式如下:假设上述利用IPHAT算法求出的两路语音信号的互相关函数的最大值组成的序列为d(n),求分数阶采样率差异Δf<sub>-frac</sub>的过程表述如下:<maths num="0004"><![CDATA[<math><mrow><mover><mi>d</mi><mo>~</mo></mover><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>n</mi><mo>=</mo><msub><mi>n</mi><mn>0</mn></msub><mo>-</mo><mi>M</mi></mrow><mrow><msub><mi>n</mi><mn>0</mn></msub><mo>+</mo><mi>M</mi></mrow></munderover><mi>d</mi><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mi>sin</mi><mi>c</mi><mrow><mo>(</mo><mi>t</mi><mo>-</mo><mi>n</mi><mo>)</mo></mrow><mo>,</mo></mrow></math>]]></maths>式中,通过sinc核函数内插的方法,将最大值序列d(n)重构成连续时间信号<img file="FDA0000090043290000022.GIF" wi="108" he="62" />n<sub>0</sub>为d(n)中最大值对应的坐标;找出连续时间信号<img file="FDA0000090043290000023.GIF" wi="84" he="62" />中的最大值max_value 1,以及该<img file="FDA0000090043290000024.GIF" wi="85" he="62" />中的最大值对应的坐标index 1;分数阶采样率差异Δf<sub>-frac</sub>表示为Δf<sub>-frac</sub>=index1-n<sub>0</sub>;然后,将上述计算出的整数点采样率差异与分数阶采样率差异相加,获取两路语音信号之间的更为精确的采样率差异Δf<sub>s</sub>:Δf<sub>s</sub>=Δf_int+Δf<sub>-frac</sub>。
地址 100190 北京市海淀区北四环西路21号中国科学院声学研究所
您可能感兴趣的专利