发明名称 基于非负低秩和稀疏矩阵分解原理的语音增强方法
摘要 本发明公开了一种基于非负低秩和稀疏矩阵分解原理的语音增强方法。该方法首先对含噪语音信号进行平滑、分帧和离散傅里叶变换,得到含噪语音频谱;然后将每帧的含噪语音幅度谱作为列向量按时间顺序排列构成一个含噪语音时频矩阵,通过对含噪语音时频矩阵进行非负低秩和稀疏矩阵分解,获得非负的低秩和稀疏矩阵;利用稀疏矩阵和含噪语音相位重构增强语音频谱,最后通过逆傅里叶变换得到时域形式的增强语音。本发明对噪声适应性强、不需要进行端点检测和模型训练、参数少易调节,强噪声环境性能好,有很好的应用前景。
申请公布号 CN103559888A 申请公布日期 2014.02.05
申请号 CN201310548773.9 申请日期 2013.11.07
申请人 航空电子系统综合技术重点实验室 发明人 孙成立;须明;王希敏;谢坚筱
分类号 G10L21/0232(2013.01)I;G10L21/0272(2013.01)I 主分类号 G10L21/0232(2013.01)I
代理机构 南昌市平凡知识产权代理事务所 36122 代理人 欧阳沁
主权项 基于非负低秩和稀疏矩阵分解原理的语音增强方法,其特征在于,用非负低秩和稀疏矩阵分解方法从含噪语音中分离出语音信号,其实现步骤如下:(1)对离散含噪语音信号进行预处理,预处理包括信号平滑和分帧;(2)将分帧后的含噪语音信号进行离散傅里叶变换,得到含噪语音频谱;(3)在频域中,将每帧语音的频谱幅度作为列向量,按时间顺序排列,由若干个语音帧构成含噪语音时频矩阵;(4)利用非负低秩和稀疏矩阵分解算法对含噪语音时频矩阵进行分解,获得非负的低秩矩阵和稀疏矩阵;分解表达式为:Y=L+S+E满足rank(L)≤r,||S||0≤h,L≥0,S≥0;其中:Y为含噪语音时频矩阵;L为低秩矩阵,对应噪声的幅度谱;S为稀疏矩阵,对应语音的幅度谱,||S||0表示稀疏矩阵S含有的非0元素个数,rank(L)表示矩阵L的秩,E为残差矩阵,r和h表示低秩和稀疏约束上限参数;(5)利用稀疏矩阵S和含噪语音的相位谱重构增强语音频谱,然后通过逆傅里叶变换,得到时域形式的增强语音。
地址 200233 上海市徐汇区桂平路432号