发明名称 | 基于低秩与稀疏矩阵分解的单通道无监督语噪分离方法 | ||
摘要 | 本发明公开了一种基于低秩与稀疏矩阵分解的单通道无监督语噪分离方法。该方法首先使用短时傅里叶变换将带噪语音时域波形变换到时频域从而得到带噪语音的幅度谱;利用低秩与稀疏矩阵分解算法将带噪语音的幅度谱分解为噪声幅度谱、语音幅度谱和残余噪声幅度谱三者之和;最后,利用短时傅里叶逆变换从语音的幅度谱中重构出的语音时域波形。本发明不需要语音和噪声的任何先验信息,属于无监督的单通道语噪分离方法,算法从带噪语音中直接分离出纯净语音,简单有效,特别适用于强噪声环境下的人声提取。 | ||
申请公布号 | CN102915742A | 申请公布日期 | 2013.02.06 |
申请号 | CN201210428465.8 | 申请日期 | 2012.10.30 |
申请人 | 中国人民解放军理工大学 | 发明人 | 张雄伟;黄建军;吴海佳;贾冲;曾理;周彬 |
分类号 | G10L21/0224(2013.01)I;G10L21/0272(2013.01)I;G10L25/45(2013.01)I | 主分类号 | G10L21/0224(2013.01)I |
代理机构 | 南京理工大学专利中心 32203 | 代理人 | 唐代盛 |
主权项 | 1.一种基于低秩与稀疏矩阵分解的单通道无监督语噪分离方法,其特征在于从带噪语音中直接分离出纯净语音,包括如下步骤:(1)利用短时傅里叶变换将带噪语音时域波形y(n)变换到时频域,得到带噪语音的幅度谱M;(2)利用低秩与稀疏矩阵分解算法对带噪语音的幅度谱M进行分解,获得噪声的幅度谱L、语音的幅度谱S和残余噪声的幅度谱R,分解为如下形式:M=L+S+R,rank(L)≤r,card(S)≤c,这里,<img file="FDA00002330530400011.GIF" wi="160" he="40" />称为低秩噪声矩阵,<img file="FDA00002330530400012.GIF" wi="160" he="40" />称为稀疏语音矩阵,<img file="FDA00002330530400013.GIF" wi="163" he="40" />称为残余噪声矩阵,rank(L)表示矩阵L的秩,card(S)表示矩阵S的势,即矩阵非零元素个数;(3)使用短时傅里叶逆变换从语音的幅度谱S中重构出的纯净语音的时域波形<img file="FDA00002330530400014.GIF" wi="99" he="44" /> | ||
地址 | 210007 江苏省南京市白下区海福巷1号 |