发明名称 | 一种基于分数阶傅立叶变换的单声道混叠语音分离方法 | ||
摘要 | 本发明涉及一种基于分数阶傅立叶变换的单声道混叠语音分离方法,属于音频信号处理技术领域。首先对混叠语音信号进行预处理,去除其静音段信号,找出浊音帧。然后,基于分数阶傅立叶变换,浊音帧信号进行基音检测,分离出混叠语音的基频,最后各条基频结合语音信号的正弦模型来合成语音,从而得到分离后的各个语音信号。本发明可有效的分离并提取出多个混叠语音的基频,最终实现混叠语音的有效分离;采用基于FrFT代替传统的FFT来提取基音频率,减少了谐波频谱的延展,得到更为准确的原始信号的基频。本发明尤其适用于分离含有两个人语音的单声道混叠语音。 | ||
申请公布号 | CN102054480A | 申请公布日期 | 2011.05.11 |
申请号 | CN200910235901.8 | 申请日期 | 2009.10.29 |
申请人 | 北京理工大学 | 发明人 | 茹婷婷;谢湘;匡镜明 |
分类号 | G10L11/00(2006.01)I | 主分类号 | G10L11/00(2006.01)I |
代理机构 | 北京理工大学专利中心 11120 | 代理人 | 张利萍;郭德忠 |
主权项 | 一种基于分数阶傅立叶变换的单声道混叠语音分离方法,其特征在于包括以下步骤:步骤一、对混叠语音信号进行预处理,去除其静音段信号,找出浊音帧;步骤二、基于分数阶傅立叶变换,对经步骤一处理后的浊音帧信号进行基音检测,分离出混叠语音的基音轨迹,也就是每个源信号的基频,过程如下:首先,根据每帧信号的连续性计算出FrFT的阶数,然后,对浊音帧信号重新进行FrFT变换,求得谐波积谱,再用动态规划方法提取出其中一个人的基频,即一个源信号的基频;当搜出一个人的基频之后,在谐波积谱中减去此人的基频和谐波所对应的谱成分,然后再使用一次动态规划,可得到另一个人的基频,即另一个源信号的基频;重复上述过程,即可得到每个源信号的基频;步骤三、根据经步骤二得到的各条基频,结合语音信号的正弦模型来合成语音,从而得到分离后的各个语音信号。 | ||
地址 | 100081 北京市海淀区中关村南大街5号 |