发明名称 一种基于连续噪声估计的语音增强方法
摘要 本发明公开一种基于连续噪声估计的语音增强方法,在对数谱域用预先训练的语音模型对背景噪声的参数进行连续估计,利用估得的噪声均值恢复纯净语音。首先,对输入语音进行声学预处理和快速傅里叶变换,得到每一帧数字语音的幅度和相位,幅度用于噪声估计和幅度谱减,相位用于恢复时域信号。然后,对数字语音的幅度谱进行子带滤波和取对数运算,得到对数谱,并利用预先训练得到的对数谱域语音模型从含噪语音的对数谱特征向量中实时提取噪声参数。最后,利用估得的噪声参数对含噪语音进行加权幅度谱减,并对增强语音的幅度和含噪语音的相位进行逆傅里叶变换和重叠相加,得到增强后的语音。本发明在含噪语音中对噪声参数按帧连续估计,实时跟踪噪声的变化。
申请公布号 CN106340292A 申请公布日期 2017.01.18
申请号 CN201610812074.4 申请日期 2016.09.08
申请人 河海大学 发明人 吕勇
分类号 G10L15/06(2013.01)I;G10L17/02(2013.01)I;G10L21/0216(2013.01)I;G10L21/0224(2013.01)I;G10L21/0316(2013.01)I 主分类号 G10L15/06(2013.01)I
代理机构 南京苏高专利商标事务所(普通合伙) 32204 代理人 李玉平
主权项 一种基于连续噪声估计的语音增强方法,其特征在于:首先,对输入语音进行声学预处理和快速傅里叶变换,得到每一帧数字语音的幅度和相位,幅度用于噪声估计和幅度谱减,相位用于恢复时域信号;然后,对数字语音的幅度谱进行子带滤波和取对数运算,得到对数谱;如果输入语音是纯净训练语音,则对数谱用于模型训练,得到高斯混合模型;如果输入语音是待增强的含噪语音,则对数谱用于噪声估计,得到噪声的均值;得到噪声均值后,即可对含噪语音进行加权幅度谱减,得到增强后的幅度谱;最后,对含噪语音的相位和估得的纯净语音幅度进行IFFT运算,恢复时域信号,并用重叠相加法得到增强后的语音。
地址 211100 江苏省南京市江宁区佛城西路8号