发明名称 一种七元麦克风阵列的声源定位方法
摘要 本发明公开了一种七元麦克风阵列的声源定位方法,该方法建立了七元麦克风阵列模型与室内声场模型;利用该麦克风阵列接收室内声源语音信号,对接收的语音信号进行采集、滤波、加窗、谱减、倒谱处理;再利用相位变换加权广义互相关方法GCC-PHAT,得各麦克风之间的时间延迟;运用三维空间定位方法与坐标旋转数字式计算机方法,确定声源位置。本发明在混响、噪声等干扰信号存在的室内环境下,能准确确定声源位置,实时性强、准确性高,在语音信号处理领域有广泛的应用。
申请公布号 CN104076331B 申请公布日期 2016.04.13
申请号 CN201410273464.X 申请日期 2014.06.18
申请人 南京信息工程大学 发明人 郭业才;宋宫琨琨;张宁;胡昭华;黄友锐
分类号 G01S5/22(2006.01)I 主分类号 G01S5/22(2006.01)I
代理机构 南京经纬专利商标代理有限公司 32200 代理人 朱小兵
主权项 一种七元麦克风阵列的声源定位方法,其特征在于,包括如下步骤:步骤一、在三维坐标系中,建立麦克风阵列模型,确定各麦克风在三维空间的位置;步骤二、对各麦克风接收到声源发出的语音信号s(t)进行采样,得到离散信号s(k),t表示时间,k表示时间序列;步骤三、对步骤二所述的离散信号s(k)进行滤波、加窗、谱减、倒谱处理,得到纯语音时域信号x(k);具体如下:(301)、将离散信号s(k)通过带通滤波器进行带通滤波后,得到带通信号;(302)、对(301)中所得带通信号用窗函数进行加窗处理,得到加窗信号s<sub>w</sub>(k);(303)、对(302)所得加窗信号s<sub>w</sub>(k)用谱减法进行去噪处理,得到谱减信号X<sub>w</sub>(f),对X<sub>w</sub>(f)作反傅里叶变换得到去噪时域信号x<sub>w</sub>(k);(304)、对去噪时域信号x<sub>w</sub>(k)由倒谱法进行消除混响处理,得到纯语音时域信号x(k);步骤四、对步骤三中的纯语音时域信号x(k),利用相位变换加权广义互相关方法GCC‑PHAT计算第i个麦克风接收的经步骤三处理所得纯语音时域信号x<sub>i</sub>(k)与三维坐标原点处第0个麦克风接收的经步骤三处理所得纯语音时域信号x<sub>0</sub>(k)间的时延值τ<sub>i</sub>,1≤i≤6且i为自然数,则互相关函数为<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msubsup><mi>R</mi><mrow><msub><mi>x</mi><mn>0</mn></msub><msub><mi>x</mi><mi>i</mi></msub></mrow><mrow><mo>(</mo><mi>g</mi><mo>)</mo></mrow></msubsup><mrow><mo>(</mo><msub><mi>&tau;</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>=</mo><msubsup><mo>&Integral;</mo><mrow><mo>-</mo><mi>&infin;</mi></mrow><mrow><mo>+</mo><mi>&infin;</mi></mrow></msubsup><msub><mi>&psi;</mi><mrow><mi>P</mi><mi>H</mi><mi>A</mi><mi>T</mi></mrow></msub><mrow><mo>(</mo><mi>f</mi><mo>)</mo></mrow><msub><mi>X</mi><mn>0</mn></msub><mrow><mo>(</mo><mi>f</mi><mo>)</mo></mrow><msubsup><mi>X</mi><mi>i</mi><mo>*</mo></msubsup><mrow><mo>(</mo><mi>f</mi><mo>)</mo></mrow><msup><mi>e</mi><mrow><mi>j</mi><mn>2</mn><msub><mi>&pi;f&tau;</mi><mi>i</mi></msub></mrow></msup><mi>d</mi><mi>f</mi><mo>;</mo></mrow>]]></math><img file="FDA0000884720270000011.GIF" wi="940" he="101" /></maths>式中,f表示频率,e表示自然指数,X<sub>0</sub>(f)表示纯语音时域信号x<sub>0</sub>(k)的傅里叶变换,X<sub>i</sub><sup>*</sup>(f)表示纯语音时域信号x<sub>i</sub>(k)傅里叶变换的共轭,<img file="FDA0000884720270000012.GIF" wi="205" he="79" />j为虚数单位,ψ<sub>PHAT</sub>(f)为加权函数,且<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><msub><mi>&psi;</mi><mrow><mi>P</mi><mi>H</mi><mi>A</mi><mi>T</mi></mrow></msub><mrow><mo>(</mo><mi>f</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mn>1</mn><mrow><mo>|</mo><msub><mi>G</mi><mrow><msub><mi>x</mi><mn>0</mn></msub><msub><mi>x</mi><mi>i</mi></msub></mrow></msub><mrow><mo>(</mo><mi>f</mi><mo>)</mo></mrow><mo>|</mo></mrow></mfrac><mo>;</mo></mrow>]]></math><img file="FDA0000884720270000013.GIF" wi="469" he="158" /></maths>式中,<img file="FDA0000884720270000014.GIF" wi="173" he="78" />为相关函数的功率谱,且<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><msub><mi>G</mi><mrow><msub><mi>x</mi><mn>0</mn></msub><msub><mi>x</mi><mi>i</mi></msub></mrow></msub><mrow><mo>(</mo><mi>f</mi><mo>)</mo></mrow><mo>=</mo><msubsup><mo>&Integral;</mo><mrow><mo>-</mo><mi>&infin;</mi></mrow><mrow><mo>+</mo><mi>&infin;</mi></mrow></msubsup><msub><mi>R</mi><mrow><msub><mi>x</mi><mn>0</mn></msub><msub><mi>x</mi><mi>i</mi></msub></mrow></msub><mrow><mo>(</mo><msub><mi>&tau;</mi><mi>i</mi></msub><mo>)</mo></mrow><msup><mi>e</mi><mrow><mi>j</mi><mn>2</mn><msub><mi>&pi;f&tau;</mi><mi>i</mi></msub></mrow></msup><msub><mi>d&tau;</mi><mi>i</mi></msub><mo>;</mo></mrow>]]></math><img file="FDA0000884720270000015.GIF" wi="662" he="101" /></maths>式中,<img file="FDA0000884720270000016.GIF" wi="605" he="77" /><img file="FDA0000884720270000017.GIF" wi="173" he="78" />表示x<sub>0</sub>(k)与x<sub>i</sub>(k)的互相关函数,则<maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><msub><mover><mi>&tau;</mi><mo>^</mo></mover><mi>i</mi></msub><mo>=</mo><mi>arg</mi><mi> </mi><mi>max</mi><mi> </mi><msubsup><mi>R</mi><mrow><msub><mi>x</mi><mn>0</mn></msub><msub><mi>x</mi><mi>i</mi></msub></mrow><mrow><mo>(</mo><mi>g</mi><mo>)</mo></mrow></msubsup><mrow><mo>(</mo><msub><mi>&tau;</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>,</mo></mrow>]]></math><img file="FDA0000884720270000021.GIF" wi="446" he="79" /></maths>其中argmax表示使<img file="FDA0000884720270000022.GIF" wi="172" he="86" />取得最大值时<maths num="0005" id="cmaths0005"><math><![CDATA[<mrow><msub><mi>&tau;</mi><mi>i</mi></msub><mo>=</mo><msub><mover><mi>&tau;</mi><mo>^</mo></mover><mi>i</mi></msub><mo>,</mo></mrow>]]></math><img file="FDA0000884720270000023.GIF" wi="156" he="70" /></maths>即<img file="FDA0000884720270000024.GIF" wi="45" he="70" />为第0个麦克风与第i个麦克风所接收到信号的时延估计值;步骤五、利用三维空间定位方法,结合步骤四中的<img file="FDA0000884720270000025.GIF" wi="75" he="69" />得声源到三维坐标原点的距离r:<maths num="0006" id="cmaths0006"><math><![CDATA[<mrow><mi>r</mi><mo>=</mo><mfrac><mrow><mn>6</mn><msup><mi>L</mi><mn>2</mn></msup><mo>-</mo><msup><mi>c</mi><mn>2</mn></msup><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mn>6</mn></munderover><msup><mrow><mo>(</mo><msub><mover><mi>&tau;</mi><mo>^</mo></mover><mi>i</mi></msub><mo>)</mo></mrow><mn>2</mn></msup></mrow><mrow><mn>2</mn><mi>c</mi><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mn>6</mn></munderover><msub><mover><mi>&tau;</mi><mo>^</mo></mover><mi>i</mi></msub></mrow></mfrac><mo>;</mo></mrow>]]></math><img file="FDA0000884720270000026.GIF" wi="429" he="270" /></maths>式中,c表示声速,L表示第i个麦克风位置M<sub>i</sub>与三维坐标原点处第0个麦克风位置M<sub>0</sub>间的距离;步骤六、利用坐标旋转数字式计算机方法,结合步骤四得到的<img file="FDA0000884720270000027.GIF" wi="70" he="70" />得声源的俯仰角θ、方位角<img file="FDA0000884720270000028.GIF" wi="45" he="53" />为<img file="FDA0000884720270000029.GIF" wi="660" he="326" />其中,<img file="FDA00008847202700000210.GIF" wi="55" he="70" />表示位置坐标为M<sub>0</sub>(0,0,0)的第0个麦克风与位置坐标为M<sub>1</sub>(L,0,0)的第1个麦克风所接收到信号的时延估计值,<img file="FDA00008847202700000211.GIF" wi="54" he="71" />表示位置坐标为M<sub>0</sub>(0,0,0)的第0个麦克风与位置坐标为M<sub>2</sub>(0,L,0)的第2个麦克风所接收到信号的时延估计值,<img file="FDA00008847202700000212.GIF" wi="57" he="71" />表示位置坐标为M<sub>0</sub>(0,0,0)的第0个麦克风与位置坐标为M<sub>3</sub>(‑L,0,0)的第3个麦克风所接收到信号的时延估计值,<img file="FDA00008847202700000213.GIF" wi="53" he="69" />表示位置坐标为M<sub>0</sub>(0,0,0)的第0个麦克风与位置坐标为M<sub>4</sub>(0,‑L,0)的第4个麦克风所接收到信号的时延估计值,<img file="FDA00008847202700000214.GIF" wi="54" he="70" />表示位置坐标为M<sub>0</sub>(0,0,0)的第0个麦克风与位置坐标为M<sub>5</sub>(0,0,‑L)的第5个麦克风所接收到信号的时延估计值,<img file="FDA00008847202700000215.GIF" wi="57" he="70" />表示位置坐标为M<sub>0</sub>(0,0,0)的第0个麦克风与位置坐标为M<sub>6</sub>(0,0,L)的第6个麦克风所接收到信号的时延估计值;步骤七、根据直角坐标与球面坐标间的关系,声源位置的直角坐标为<img file="FDA0000884720270000031.GIF" wi="382" he="229" />
地址 215101 江苏省苏州市吴中区木渎镇中山东路70号吴中科技创业园2号楼2310室