发明名称 一种针对刻意伪装语音的说话人识别方法
摘要 本发明设计了一种针对刻意伪装语音的说话人识别方法。首先针对说话者提高音调、压低音调、快速、慢速、捏鼻子、捂嘴、咬物(叼铅笔)、嚼物(嚼口香糖)这8种刻意伪装语音在无噪声无反射的消声室中建立了合理的录制方案,然后基于基音周期预分类后再采用Mel频率倒谱系数和高斯混合模型进行说话人伪装下的辨认,最后采用自适应调整组别实现高质量的伪装语音说话人识别。该方法可应用于犯罪分子使用伪装发音掩盖身份的语音案件中。
申请公布号 CN104464724A 申请公布日期 2015.03.25
申请号 CN201410743616.8 申请日期 2014.12.08
申请人 南京邮电大学 发明人 孙林慧;杨震
分类号 G10L15/06(2013.01)I;G10L15/02(2006.01)I 主分类号 G10L15/06(2013.01)I
代理机构 南京知识律师事务所 32207 代理人 汪旭东
主权项 一种针对刻意伪装语音的说话人识别方法,其特征在于:所述识别方法包括说话人刻意伪装方式下语音的采集方法设计和基于基音周期预分类的针对刻意伪装语音的说话人的识别;所述基于基音周期预分类的针对刻意伪装语音的说话人的识别分为训练和实测两个阶段;训练阶段,包括特征提取和模型训练,特征提取部分以基音周期和MFCC作为主要研究的特征参数,用基音周期为标准对说话人性别进行预分类,然后使用24阶MFCC对GMM进行训练,得到两个性别子类说话人的GMM参数,存储以备第二部分调用;第二部分为对伪装语音的说话人鉴别阶段,分别用两个主函数实现,首先在判别该说话人的性别后,将其划分到所属的性别子类中,然后读取该子类的说话人的GMM参数,同样以MFCC作为特征参数,计算待识说话人在各个注册说话人模型下的概率,取出匹配距离最小即后验概率最大的说话人作为识别出来的说话人,针对预分类个别的错误采用后续的自适应方式加以修正,当识别效果很差时,自适应调整到另一个性别子类进行识别,二者比较取识别率高的作为最终的识别结果。
地址 210003 江苏省南京市新模范马路66号