发明名称 一种基于PSM变调的语音识别及其还原方法及其装置
摘要 本发明公开一种基于PSM变调的语音识别及其还原方法及其装置,利用语音的基频特性估计变调后伸缩系数,并对美频率倒谱系数提取算法进行了改进,即利用线性插值伸缩将估计的变调系数整合到美频率倒谱系数提取算法中,使其能近似计算出变调语音在变调前的美频率倒谱系数。最后利用时间动态规整作为匹配方法,计算语音之间的相似度。同时,还能利用该估计的伸缩系数将变调后的语音还原为原语音。
申请公布号 CN102354496B 申请公布日期 2013.08.21
申请号 CN201110183006.3 申请日期 2011.07.01
申请人 中山大学 发明人 王泳;黄继武
分类号 G10L17/00(2013.01)I 主分类号 G10L17/00(2013.01)I
代理机构 广州粤高专利商标代理有限公司 44102 代理人 禹小明
主权项 一种基于PSM语音变调的识别方法,其特征在于,所述方法为:输入测试语音和参考语音,所述参考语音为经过PSM变调后的语音,所述测试语音为未经PSM变调的语音;提取测试语音的美频率倒谱系数;提取所述测试语音和参考语音的基频,计算出伸缩系数;对美频率倒谱系数的提取算法采用所述伸缩系数进行线性插值伸缩,得出改进型提取算法,用所述改进型提取算法提取所述参考语音的美频率倒谱系数,根据所述参考语音的美频率倒谱系数与所述测试语音的美频率倒谱系数作匹配计算,若所得值大于预设值则识别为不同音源的语音,若不大于预设值,则识别为同一音源的语音; 计算所述伸缩系数的估计方法为:α′=mean(Fr)/mean(Ft),其中α′为所述伸缩系数,mean(Fr)为所述参考语音的基频值的平均值,mean(Ft)为所述测试语音的基频值的平均值。
地址 510275 广东省广州市新港西路135号