发明名称 数字助听器中融合相位估计与人耳听觉特性的语音增强方法
摘要 本发明公开数字助听器中融合相位估计与人耳听觉特性的语音增强方法,该方法首先通过傅里叶变换得到含噪语音的频域表达式;采用最小值控制递归平均方法获得噪声功率谱;获得初步增强语音和噪声的幅度谱;通过可改善低信噪比环境下语音失真的相位估计来修正语音和噪声的相位,获得初步增强语音和噪声;其次,将初步增强语音和噪声分别通过模拟人工耳蜗工作机理的gammatone滤波器组,进行滤波处理,对其时频分析,得到有时频单元组成的时频表示形式;最后,利用人耳的听觉特性,计算含噪语音在时频域的二值掩蔽,利用掩蔽值合成得到增强后的语音。该方法结合了人耳听觉特性,使数字助听器的输出语音信号的质量得到了很大的提高。
申请公布号 CN105741849A 申请公布日期 2016.07.06
申请号 CN201610125876.8 申请日期 2016.03.06
申请人 北京工业大学 发明人 李如玮;王帅
分类号 G10L21/0232(2013.01)I;G10L21/0332(2013.01)I;G10L21/0224(2013.01)I 主分类号 G10L21/0232(2013.01)I
代理机构 北京思海天达知识产权代理有限公司 11203 代理人 沈波
主权项 数字助听器中融合相位估计与人耳听觉特性的语音增强方法,其特征在于:通过对数幅度谱估计和语音相位估计修正初步增强语音的相位,获得较为准确的语音信号和噪声,接着通过基于可以模拟人耳听觉特性,能对人耳基底膜进行仿真的gammatone滤波器组,对语音信号和噪声进行时频分析,计算二值掩蔽,利用了人耳听觉感知理论,结合了人耳听觉掩蔽特性;具体过程包括步骤如下,步骤一,数字助听器的输入信号进行预处理,首先对输入信号进行去均值、归一化、预加重、分帧、加窗处理;步骤二,通过傅里叶变换计算出含噪语音信号的频谱;步骤三,通过最小值控制递归平均算法,计算出含噪语音信号中的噪声分量即噪声功率;步骤四,通过估计出来的噪声功率得到后验信噪比,利用判决引导法得到先验信噪比;步骤五,通过先验信噪比和后验信噪比得出对数幅度谱估计器增益函数,利用对数幅度谱估计器从含噪语音中得到初步增强的语音信号的幅度谱;步骤六,根据语音和噪声频谱的统计模型的对称性得到用先验信噪比倒数形式表示的噪声频谱估计值,推导出噪声的增益函数,进而从含噪语音中得到噪声信号的幅度谱;步骤七,相位估计,利用噪声相位和步骤五、步骤六得到的语音信号幅度谱和噪声幅度谱估计出其相位修正值,得到语音信号和噪声的相位;步骤八,进行傅里叶逆变换,将初步增强的语音信号幅度谱和噪声幅度谱,乘以从步骤七中修正后的相位,然后通过傅里叶逆变换分别得到初步增强的语音信号和噪声信号;步骤九,时频处理,利用人耳听觉感知理论,结合人耳的听觉特性和耳蜗的工作机理,将初步增强的语音信号和噪声信号分别通过可以模拟人工耳蜗模型的gammatone滤波器组进行滤波处理,将其频谱范围非均匀地分为N个频带,得到由时频单元组成的时频表达形式;步骤十,利用人耳的听觉掩蔽特性,计算出含噪语音在时频域的二值掩蔽;步骤十一,时频掩蔽,利用步骤十得到的掩蔽值得到最终的输出信号。
地址 100124 北京市朝阳区平乐园100号