发明名称 一种基于谐波提取的欠定语音盲分离方法及装置
摘要 本发明公开了一种基于谐波提取的欠定语音盲分离方法及装置,在盲识别阶段,对语音信号进行短时傅立叶变换,利用基于比值法频谱校正的谐波提取技术提取语音信号中的谐波成分,通过相位一致性准则对所述谐波成分做筛选;引入可估计源数的自适应K‑均值聚类法对筛选出的单源成分向量进行聚类,得到混合矩阵的估计;在盲恢复阶段,针对各路源语音信号在时频域中存在重叠的情况,采用子空间投影法对混合矩阵的估计做逆推,实现了高质量的语音信号源恢复。本发明提高了算法精度;可有效地识别出强单源成分,增强了对噪声的鲁棒性;可在源数目未知的情形下获得混合矩阵及源数目估计;并且本发明提高了适用范围,同时也可提高语音信号的恢复精度。
申请公布号 CN106531181A 申请公布日期 2017.03.22
申请号 CN201611055302.4 申请日期 2016.11.25
申请人 天津大学 发明人 黄翔东;刘明卓;徐婧文
分类号 G10L21/0272(2013.01)I;G10L21/0308(2013.01)I;G10L21/047(2013.01)I 主分类号 G10L21/0272(2013.01)I
代理机构 天津市北洋有限责任专利代理事务所 12201 代理人 李林娟
主权项 一种基于谐波提取的欠定语音盲分离方法,其特征在于,所述欠定语音盲分离方法包括以下步骤:在盲识别阶段,对语音信号进行短时傅立叶变换,利用基于比值法频谱校正的谐波提取技术提取语音信号中的谐波成分,通过相位一致性准则对所述谐波成分做筛选;引入可估计源数的自适应K‑均值聚类法对筛选出的单源成分向量进行聚类,得到混合矩阵的估计;在盲恢复阶段,针对各路源语音信号在时频域中存在重叠的情况,采用子空间投影法对混合矩阵的估计做逆推,实现了高质量的语音信号源恢复。
地址 300072 天津市南开区卫津路92号