发明名称 一种麦克风阵列语音增强的优化方法
摘要 本发明公开了一种麦克风阵列语音增强的优化方法,涉及语音增强技术,特别涉及麦克风阵列语音增强,属于语音信号处理技术领域。该方法首先采用广义旁瓣抵消器结构,针对广义旁瓣抵消器因信号到达方向错误而导致语音泄漏的问题,利用GSC的输出与阻塞矩阵输出存在相关性的特点,对阻塞矩阵进行自适应调整,使阻塞矩阵趋近于目标语音方向,以减少阻塞矩阵中目标语音的泄漏,增强系统的鲁棒性。
申请公布号 CN102664023A 申请公布日期 2012.09.12
申请号 CN201210127757.8 申请日期 2012.04.26
申请人 南京邮电大学 发明人 王辉;张玲华
分类号 G10L21/02(2006.01)I 主分类号 G10L21/02(2006.01)I
代理机构 南京经纬专利商标代理有限公司 32200 代理人 艾中兰
主权项 1.一种麦克风阵列语音增强的优化方法,其特征在于包含以下步骤:第一步,前期处理,即完成对输入阵列语音信号进行预加重、分帧和加窗处理后,利用时延估计方法得到声源的方向信息,利用方向信息得到信号的导向矢量;第二步,利用麦克风阵列搭建GSC结构模型,首先实现固定波束形成算法,有别于常规的GSC结构处理,它将FBF分成两部分:信号对齐和波束形成,首先利用前期处理得到的方向信息进行信号对齐,信号对齐是利用第一步中得到的导向矢量,将有方向时延的麦克风阵列信号变为从阵列法线方向输入信号,这样在理论上,麦克风阵列将从0°方向入射,将对齐后的信号分为两路,一路继续进行固定波束形成过程,累加求平均;另一路进入阻塞矩阵模块对目标信号进行阻塞;第三步,实现阻塞矩阵模块,由于通过在第二步进行信号对齐,理论上信号方向为0°,在采用直线均匀阵时,阻塞矩阵采用如下形式:<img file="FDA0000157411340000011.GIF" wi="1808" he="652" />其中B<sub>0</sub>为阻塞矩阵,θ<sub>0</sub>为阻塞方向,d为阵元间距,λ为声波波长,M为输入信号数,此时不论到达方向为何,初始θ<sub>0</sub>都为0,通过阻塞矩阵后信号输入MC模块;第四步,实现MC模块,理论上由FBF输出减去BM输出,将得到纯净的目标语音,这时考虑到发生方向估计错误时存在语音泄漏,MC的输出暂时不作为最终输出;第五步,提取MC的输出,利用MC输出与BM输出之间的相关性,当相关函数较大时,存在泄漏语音,对相关函数值设定阈值,当超过阈值时,以θ<sub>0</sub>为0作为初始参数,设定调整步长,以相关函数值减少为调整方向,通过倍乘方式调整参数,最终使相关函数值小于阈值,最后才在MC模块输出语音。
地址 210003 江苏省南京市鼓楼区新模范马路66号