主权项 |
1.一种麦克风阵列语音增强的优化方法,其特征在于包含以下步骤:第一步,前期处理,即完成对输入阵列语音信号进行预加重、分帧和加窗处理后,利用时延估计方法得到声源的方向信息,利用方向信息得到信号的导向矢量;第二步,利用麦克风阵列搭建GSC结构模型,首先实现固定波束形成算法,有别于常规的GSC结构处理,它将FBF分成两部分:信号对齐和波束形成,首先利用前期处理得到的方向信息进行信号对齐,信号对齐是利用第一步中得到的导向矢量,将有方向时延的麦克风阵列信号变为从阵列法线方向输入信号,这样在理论上,麦克风阵列将从0°方向入射,将对齐后的信号分为两路,一路继续进行固定波束形成过程,累加求平均;另一路进入阻塞矩阵模块对目标信号进行阻塞;第三步,实现阻塞矩阵模块,由于通过在第二步进行信号对齐,理论上信号方向为0°,在采用直线均匀阵时,阻塞矩阵采用如下形式:<img file="FDA0000157411340000011.GIF" wi="1808" he="652" />其中B<sub>0</sub>为阻塞矩阵,θ<sub>0</sub>为阻塞方向,d为阵元间距,λ为声波波长,M为输入信号数,此时不论到达方向为何,初始θ<sub>0</sub>都为0,通过阻塞矩阵后信号输入MC模块;第四步,实现MC模块,理论上由FBF输出减去BM输出,将得到纯净的目标语音,这时考虑到发生方向估计错误时存在语音泄漏,MC的输出暂时不作为最终输出;第五步,提取MC的输出,利用MC输出与BM输出之间的相关性,当相关函数较大时,存在泄漏语音,对相关函数值设定阈值,当超过阈值时,以θ<sub>0</sub>为0作为初始参数,设定调整步长,以相关函数值减少为调整方向,通过倍乘方式调整参数,最终使相关函数值小于阈值,最后才在MC模块输出语音。 |