一种基于分数阶傅立叶变换的单声道混叠语音分离方法,申请号CN200910235901.8-传众专利搜索

发明名称	一种基于分数阶傅立叶变换的单声道混叠语音分离方法
摘要	本发明涉及一种基于分数阶傅立叶变换的单声道混叠语音分离方法，属于音频信号处理技术领域。首先对混叠语音信号进行预处理，去除其静音段信号，找出浊音帧。然后，基于分数阶傅立叶变换，浊音帧信号进行基音检测，分离出混叠语音的基频，最后各条基频结合语音信号的正弦模型来合成语音，从而得到分离后的各个语音信号。本发明可有效的分离并提取出多个混叠语音的基频，最终实现混叠语音的有效分离；采用基于FrFT代替传统的FFT来提取基音频率，减少了谐波频谱的延展，得到更为准确的原始信号的基频。本发明尤其适用于分离含有两个人语音的单声道混叠语音。
申请公布号	CN102054480A	申请公布日期	2011.05.11
申请号	CN200910235901.8	申请日期	2009.10.29
申请人	北京理工大学	发明人	茹婷婷;谢湘;匡镜明
分类号	G10L11/00(2006.01)I	主分类号	G10L11/00(2006.01)I
代理机构	北京理工大学专利中心 11120	代理人	张利萍;郭德忠
主权项	一种基于分数阶傅立叶变换的单声道混叠语音分离方法，其特征在于包括以下步骤：步骤一、对混叠语音信号进行预处理，去除其静音段信号，找出浊音帧；步骤二、基于分数阶傅立叶变换，对经步骤一处理后的浊音帧信号进行基音检测，分离出混叠语音的基音轨迹，也就是每个源信号的基频，过程如下：首先，根据每帧信号的连续性计算出FrFT的阶数，然后，对浊音帧信号重新进行FrFT变换，求得谐波积谱，再用动态规划方法提取出其中一个人的基频，即一个源信号的基频；当搜出一个人的基频之后，在谐波积谱中减去此人的基频和谐波所对应的谱成分，然后再使用一次动态规划，可得到另一个人的基频，即另一个源信号的基频；重复上述过程，即可得到每个源信号的基频；步骤三、根据经步骤二得到的各条基频，结合语音信号的正弦模型来合成语音，从而得到分离后的各个语音信号。
地址	100081 北京市海淀区中关村南大街5号