发明名称 基于压缩感知和K-SVD的单通道混合语音分离方法
摘要 一种基于压缩感知和K-SVD的单通道混合语音分离方法,采用K-SVD算法,对包括男男、男女及女女三类混合训练语音,由混合训练语音帧对每类混合训练语音各构造一个普遍适用的过完备字典即K-SVD字典,满足重构误差在某一范围的同时信号在该字典下稀疏,基于所构造的K-SVD字典,从压缩感知观测和单通道混合语音表达式的相似性出发,采用压缩感知理论中基于l0-范数优化的信号重构算法,分离单通道混合语音,基于各单通道混合语音帧的表达式,求取各源语音帧在K-SVD字典下稀疏表示的估计,再由该稀疏表示的估计和K-SVD字典,重构得到各分离语音帧,最后将各分离语音帧顺序连接,得到分离后的语音信号。
申请公布号 CN102081928A 申请公布日期 2011.06.01
申请号 CN201010556694.9 申请日期 2010.11.24
申请人 南京邮电大学 发明人 郭海燕;杨震
分类号 G10L21/02(2006.01)I;G10L19/00(2006.01)I 主分类号 G10L21/02(2006.01)I
代理机构 南京经纬专利商标代理有限公司 32200 代理人 奚幼坚
主权项 一种基于压缩感知和K‑SVD的单通道混合语音分离方法,其特征在于:本方法利用语音信号在K‑SVD字典下的稀疏性,根据压缩感知观测和单通道混合语音在表达式上的相似性,采用压缩感知理论中的信号重构方法,进行单通道混合语音的分离,以达到增强目标语音抑制干扰语音的目的,采取的步骤是:1)采用K‑SVD算法,对男男、男女及女女三类混合训练语音分帧,由混合训练语音帧对每类混合训练语音各构造一个普遍适用的过完备字典即K‑SVD字典;2)将单通道混合语音分帧,逐帧分离单通道混合语音;基于所构造的K‑SVD字典和各单通道混合语音帧的表达式,从压缩感知观测和单通道混合语音表达式的相似性出发,采用压缩感知理论中基于l0‑范数优化的信号重构算法,求取各源语音帧在K‑SVD字典下稀疏表示的估计,由该稀疏表示的估计和K‑SVD字典的乘积,重构得到各分离语音帧;3)将各分离语音帧顺序连接,得到分离后的语音信号。
地址 210003 江苏省南京市鼓楼区新模范马路66号