发明名称 一种非平稳噪声环境下传声器阵列的语音增强方法
摘要 本发明涉及一种在非平稳噪声环境下传声器阵列的语音增强方法,通过利用通道之间的相位信息,准确判断有效信号的概率,以提高抗非平稳噪声干扰的性能。该方法估计出有效信号存在概率具体包括如下步骤:(51)根据所需波束宽度计算门限T<sub>1</sub>=NL sin(θ)/Fs,其中N表示帧长,L表示传声器单元间距,θ表示波束宽度,Fs为采样频率;(52)计算各通道输入信号在各频率点相位差ω的和值pd(n,ω);(53)当pd(n,ω)>ω(M-1)T<sub>1</sub>时,该频率点存在有效信号概率p<sub>1</sub>(n,ω)=1,否则p<sub>1</sub>(n,ω)=0,其中,M表示传声器个数。本发明由于利用了通道之间的相位信息,使得对有效信号的概率判断更加准确,提高了拾取语音的信噪比,提高了整体性能,特别是抗非平稳噪声干扰性能。
申请公布号 CN103165137B 申请公布日期 2015.05.06
申请号 CN201110427329.2 申请日期 2011.12.19
申请人 中国科学院声学研究所 发明人 吴鸣;杨飞然;杨军
分类号 G10L21/0208(2013.01)I 主分类号 G10L21/0208(2013.01)I
代理机构 北京法思腾知识产权代理有限公司 11318 代理人 杨小蓉;高宇
主权项 一种非平稳噪声环境下传声器阵列的语音增强方法,该方法包括的步骤如下:(1)根据传声器阵列的输入信号估计出噪声参考信号r(n);(2)采用自适应算法初步滤除各通道的输入信号中所含的噪声信号;(3)对各通道中自适应滤波器的输出信号进行分帧加窗,再采用快速傅立叶变换变换至频域;(4)估计背景噪声功率谱n(ω),并由此得到当前帧的信噪比SNR(n,ω);(5)利用各通道之间的相位信息,再进一步根据和值与预定义门限T<sub>1</sub>的关系得到有效语音信号存在概率p<sub>1</sub>(n,ω);(6)估计出当前帧是有效语音帧的概率p<sub>f</sub>(n);(7)计算出输出信号在各个频率点增益G(n,ω);(8)把处理后的频谱信号通过反傅里叶变换变换到时间域,作为输出信号;所述步骤(5)中的估计出有效信号存在概率具体包括如下步骤:(51)根据所需波束宽度计算门限T<sub>1</sub>=NLsin(θ)/Fs,其中N表示帧长,L表示传声器单元间距,θ表示波束宽度,Fs为采样频率;(52)计算各通道输入信号在各频率点相位差ω的和值pd(n,ω);(53)当pd(n,ω)>ω(M‑1)T<sub>1</sub>时,该频率点存在有效信号概率p<sub>1</sub>(n,ω)=1,否则p<sub>1</sub>(n,ω)=0,其中,M表示传声器个数。
地址 100190 北京市海淀区北四环西路21号