发明名称 一种基于分数阶傅立叶变换的单声道混叠语音分离方法
摘要 本发明涉及一种基于分数阶傅立叶变换的单声道混叠语音分离方法,属于音频信号处理技术领域。首先对混叠语音信号进行预处理,去除其静音段信号,找出浊音帧。然后,基于分数阶傅立叶变换,浊音帧信号进行基音检测,分离出混叠语音的基频,最后各条基频结合语音信号的正弦模型来合成语音,从而得到分离后的各个语音信号。本发明可有效的分离并提取出多个混叠语音的基频,最终实现混叠语音的有效分离;采用基于FrFT代替传统的FFT来提取基音频率,减少了谐波频谱的延展,得到更为准确的原始信号的基频。本发明尤其适用于分离含有两个人语音的单声道混叠语音。
申请公布号 CN102054480A 申请公布日期 2011.05.11
申请号 CN200910235901.8 申请日期 2009.10.29
申请人 北京理工大学 发明人 茹婷婷;谢湘;匡镜明
分类号 G10L11/00(2006.01)I 主分类号 G10L11/00(2006.01)I
代理机构 北京理工大学专利中心 11120 代理人 张利萍;郭德忠
主权项 一种基于分数阶傅立叶变换的单声道混叠语音分离方法,其特征在于包括以下步骤:步骤一、对混叠语音信号进行预处理,去除其静音段信号,找出浊音帧;步骤二、基于分数阶傅立叶变换,对经步骤一处理后的浊音帧信号进行基音检测,分离出混叠语音的基音轨迹,也就是每个源信号的基频,过程如下:首先,根据每帧信号的连续性计算出FrFT的阶数,然后,对浊音帧信号重新进行FrFT变换,求得谐波积谱,再用动态规划方法提取出其中一个人的基频,即一个源信号的基频;当搜出一个人的基频之后,在谐波积谱中减去此人的基频和谐波所对应的谱成分,然后再使用一次动态规划,可得到另一个人的基频,即另一个源信号的基频;重复上述过程,即可得到每个源信号的基频;步骤三、根据经步骤二得到的各条基频,结合语音信号的正弦模型来合成语音,从而得到分离后的各个语音信号。
地址 100081 北京市海淀区中关村南大街5号