发明名称 基于非连续平滑的卷积混合盲分离频域方法
摘要 本发明涉及一种基于非连续平滑的卷积混合盲分离频域方法。本方法是将各路卷积混合信号执行短时傅立叶变换,继而对短时傅立叶变换系数进行非连续多时刻短时傅立叶变换系数平滑。在每个频率片上利用近似联合对角化方法对平滑结果执行瞬时混合盲分离,获得每个频率片上的混合矩阵和分离信号。利用分离信号的实部调整各频率片上混合矩阵的列向量的顺序,并利用各频率片上调整后混合矩阵的逆阵生成分离滤波器阵列。将卷积混合信号通过分离滤波器阵列生成分离信号,完成卷积混合盲分离。该方法有助于降低源信号STFT系数的瞬时混合和卷积混合信号STFT系数间的误差,从而提升分离性能。此外,相对于传统各频率片上混合矩阵的列向量的顺序调整方法,本发明方法显著降低了运算量。
申请公布号 CN101086730A 申请公布日期 2007.12.12
申请号 CN200710043771.9 申请日期 2007.07.13
申请人 上海大学 发明人 王超;方勇;张倩;吴美武
分类号 G06F17/14(2006.01) 主分类号 G06F17/14(2006.01)
代理机构 上海上大专利事务所 代理人 何文欣
主权项 1.一种基于非连续平滑的卷积混合频域盲分离方法,用于减少源信号STFT的瞬时混合和卷积混合信号STFT间的误差,提高卷积混合频域盲分离的分离效果,其特征在于具体步骤如下:(1)对卷积混合信号X<sub>i</sub>(n)做帧长为T帧移为o的分帧,并求各帧X<sub>i</sub>(l)(i=1,2,…,D)的T点短时傅立叶变换,得<img file="A2007100437710002C1.GIF" wi="183" he="57" />及矢量序列<![CDATA[ <math><mrow><mover><mi>X</mi><mo>&OverBar;</mo></mover><mrow><mo>(</mo><msub><mi>w</mi><mi>k</mi></msub><mo>,</mo><mi>l</mi><mo>)</mo></mrow><mo>=</mo><msup><mrow><mo>[</mo><msub><mover><mi>X</mi><mo>&OverBar;</mo></mover><mn>1</mn></msub><mrow><mo>(</mo><msub><mi>w</mi><mi>k</mi></msub><mo>,</mo><mi>l</mi><mo>)</mo></mrow><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msub><mover><mi>X</mi><mo>&OverBar;</mo></mover><mi>D</mi></msub><mrow><mo>(</mo><msub><mi>w</mi><mi>k</mi></msub><mo>,</mo><mi>l</mi><mo>)</mo></mrow><mo>]</mo></mrow><mo>&prime;</mo></msup><mo>,</mo></mrow></math>]]></maths>其中w<sub>k</sub>=2πk/T,k∈[0,T-1],i∈{1,2,…,D},l表示帧的序号;(2)在各频率片w<sub>k</sub>上,生成<img file="A2007100437710002C3.GIF" wi="171" he="58" />的非连续多时刻短时傅立叶变换系数平滑结果<![CDATA[ <math><mrow><mi>E</mi><mrow><mo>(</mo><mover><mi>X</mi><mo>&OverBar;</mo></mover><mrow><mo>(</mo><msub><mi>w</mi><mi>k</mi></msub><mo>,</mo><mi>l</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>=</mo><mfrac><mn>1</mn><mi>P</mi></mfrac><msubsup><mi>&Sigma;</mi><mrow><mi>p</mi><mo>=</mo><mn>0</mn></mrow><mrow><mi>P</mi><mo>-</mo><mn>1</mn></mrow></msubsup><mover><mi>X</mi><mo>&OverBar;</mo></mover><mrow><mo>(</mo><msub><mi>w</mi><mi>k</mi></msub><mo>,</mo><mi>l</mi><mo>+</mo><mi>p</mi><mo>&CenterDot;</mo><mi>T</mi><mo>)</mo></mrow><mo>,</mo></mrow></math>]]></maths>其中为P平滑因子,T为前述的分帧帧长。(3)利用<img file="A2007100437710002C5.GIF" wi="244" he="56" />执行频率片w<sub>k</sub>上的瞬时混合盲分离,获得频率片w<sub>k</sub>上的混合矩阵的估计值<img file="A2007100437710002C6.GIF" wi="125" he="67" />和分离信号<![CDATA[ <math><mrow><mi>E</mi><mrow><mo>(</mo><mover><mi>S</mi><mo>&OverBar;</mo></mover><mrow><mo>(</mo><msub><mi>w</mi><mi>k</mi></msub><mo>,</mo><mi>l</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>=</mo><mfrac><mn>1</mn><mi>P</mi></mfrac><msubsup><mi>&Sigma;</mi><mrow><mi>p</mi><mo>=</mo><mn>0</mn></mrow><mrow><mi>P</mi><mo>-</mo><mn>1</mn></mrow></msubsup><mover><mi>S</mi><mo>&OverBar;</mo></mover><mrow><mo>(</mo><msub><mi>w</mi><mi>k</mi></msub><mo>,</mo><mi>l</mi><mo>+</mo><mi>&beta;</mi><mo>&CenterDot;</mo><mi>p</mi><mo>)</mo></mrow><mo>;</mo></mrow></math>]]></maths>(4)按集合独立的原理,依据<img file="A2007100437710002C8.GIF" wi="235" he="54" />调整各频率片上<img file="A2007100437710002C9.GIF" wi="127" he="66" />列向量间的对应关系,生成真实的<![CDATA[ <math><mrow><mover><mi>H</mi><mo>&OverBar;</mo></mover><mrow><mo>(</mo><msub><mi>w</mi><mi>k</mi></msub><mo>)</mo></mrow><mrow><mo>(</mo><mn>0</mn><mo>&le;</mo><mi>q</mi><mo>&le;</mo><mi>T</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>,</mo></mrow></math>]]></maths>从而克服不同频率片上顺序不确定性的不统一:a)以矢量<img file="A2007100437710002C11.GIF" wi="235" he="57" />中各元素的实部构成矢量<![CDATA[ <math><mrow><mi>Y</mi><mrow><mo>(</mo><msub><mi>w</mi><mi>k</mi></msub><mo>,</mo><mi>l</mi><mo>)</mo></mrow><mo>=</mo><msup><mrow><mo>[</mo><msub><mover><mi>Y</mi><mo>&OverBar;</mo></mover><mn>1</mn></msub><mrow><mo>(</mo><msub><mi>w</mi><mi>k</mi></msub><mo>,</mo><mi>l</mi><mo>)</mo></mrow><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msub><mover><mi>Y</mi><mo>&OverBar;</mo></mover><mi>D</mi></msub><mrow><mo>(</mo><msub><mi>w</mi><mi>k</mi></msub><mo>,</mo><mi>l</mi><mo>)</mo></mrow><mo>]</mo></mrow><mo>&prime;</mo></msup><mo>,</mo></mrow></math>]]></maths>又令参考频率片为w<sub>r</sub>=0,则第k个频率片w<sub>k</sub>上与<![CDATA[ <math><mrow><msub><mover><mi>Y</mi><mo>&OverBar;</mo></mover><mi>i</mi></msub><mrow><mo>(</mo><msub><mi>w</mi><mi>r</mi></msub><mo>,</mo><mi>l</mi><mo>)</mo></mrow><mrow><mo>(</mo><mi>i</mi><mo>=</mo><mn>1</mn><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><mi>D</mi><mo>)</mo></mrow></mrow></math>]]></maths>对应的输出序列为<![CDATA[ <math><mrow><msub><mover><mi>O</mi><mo>&OverBar;</mo></mover><mi>i</mi></msub><mrow><mo>(</mo><msub><mi>w</mi><mi>k</mi></msub><mo>,</mo><mi>l</mi><mo>)</mo></mrow><mo>=</mo><msub><mover><mi>Y</mi><mo>&OverBar;</mo></mover><mrow><mi>&sigma;</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>k</mi><mo>)</mo></mrow></mrow></msub><mrow><mo>(</mo><msub><mi>w</mi><mi>k</mi></msub><mo>,</mo><mi>l</mi><mo>)</mo></mrow><mo>,</mo></mrow></math>]]></maths>其中<![CDATA[ <math><mrow><msub><mover><mi>O</mi><mo>&OverBar;</mo></mover><mi>i</mi></msub><mrow><mo>(</mo><msub><mi>w</mi><mi>r</mi></msub><mo>,</mo><mi>l</mi><mo>)</mo></mrow><mo>=</mo><msub><mover><mi>Y</mi><mo>&OverBar;</mo></mover><mi>i</mi></msub><mrow><mo>(</mo><msub><mi>w</mi><mi>r</mi></msub><mo>,</mo><mi>l</mi><mo>)</mo></mrow><mo>,</mo></mrow></math>]]></maths><![CDATA[ <math><mrow><mi>&sigma;</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>k</mi><mo>)</mo></mrow><mo>=</mo><munder><mrow><mi>arg</mi><mi>max</mi></mrow><mrow><mi>j</mi><mo>=</mo><mn>1,2</mn><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><mi>D</mi></mrow></munder><mrow><mo>(</mo><mo>|</mo><mi>Exp</mi><mo>{</mo><mo>[</mo><msub><mover><mi>O</mi><mo>&OverBar;</mo></mover><mi>i</mi></msub><mrow><mo>(</mo><msub><mi>w</mi><mi>r</mi></msub><mo>,</mo><mi>l</mi><mo>)</mo></mrow><mo>-</mo><mi>Exp</mi><mrow><mo>(</mo><msub><mover><mi>O</mi><mo>&OverBar;</mo></mover><mi>i</mi></msub><mrow><mo>(</mo><msub><mi>w</mi><mi>r</mi></msub><mo>,</mo><mi>l</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>]</mo><msup><mrow><mo>[</mo><msub><mover><mi>O</mi><mo>&OverBar;</mo></mover><mi>j</mi></msub><mrow><mo>(</mo><msub><mi>w</mi><mi>k</mi></msub><mo>,</mo><mi>l</mi><mo>)</mo></mrow><mo>-</mo><mi>Exp</mi><mrow><mo>(</mo><msub><mover><mi>O</mi><mo>&OverBar;</mo></mover><mi>j</mi></msub><mrow><mo>(</mo><msub><mi>w</mi><mi>k</mi></msub><mo>,</mo><mi>l</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>]</mo></mrow><mo>*</mo></msup><mo>}</mo><mo>|</mo><mo>)</mo></mrow><mo>,</mo></mrow></math>]]></maths>Exp表示取数学期望;b)生成D×D的单位矩阵I、调整矩阵Λ<sub>k</sub>和真实的<img file="A2007100437710002C17.GIF" wi="152" he="54" />其中Λ(:,i)=I(:,σ(i,k)),<![CDATA[ <math><mrow><mover><mi>H</mi><mo>&OverBar;</mo></mover><mrow><mo>(</mo><msub><mi>w</mi><mi>k</mi></msub><mo>)</mo></mrow><mo>=</mo><mover><mi>H</mi><mover><mo>&OverBar;</mo><mo>^</mo></mover></mover><mrow><mo>(</mo><msub><mi>w</mi><mi>k</mi></msub><mo>)</mo></mrow><mo>&CenterDot;</mo><msub><mi>&Lambda;</mi><mi>k</mi></msub><mo>;</mo></mrow></math>]]></maths>(5)对调整后的<img file="A2007100437710002C19.GIF" wi="150" he="55" />w<sub>k</sub>=2πk/T,k∈[0,T-1],利用逆短时傅立叶变换生成逆混合滤波器阵列生成最终的卷积混合分离信号。
地址 200444上海市宝山区上大路99号