发明名称 说话人识别方法和系统
摘要 本发明提供了一种说话人识别方法和系统,该方法可以包括:获取待识别说话人的语音信号;提取所述语音信号中的基音特征参量、倒谱特征参量及功率谱特征参量;将所述基音特征参量、倒谱特征参量及功率谱特征参量与特征模板中预置的相应语音信号的特征参量分别进行匹配,获取待识别语音信号的综合匹配失真值及综合匹配路径偏差;根据所述综合匹配失真值及综合匹配路径偏差,获取待识别语音信号的最终比对误差;如果所述最终比对误差低于预设综合匹配对比阈值,则确认该说话人。本发明将三种待识别特征有机地结合起来,根据三种特征的匹配路径进行待识别目标与特征模板的比对,来决定系统识别结果,能够稳定和可靠地识别说话人,并提高识别率。
申请公布号 CN101436405A 申请公布日期 2009.05.20
申请号 CN200810246575.6 申请日期 2008.12.25
申请人 北京中星微电子有限公司 发明人 张晨;冯宇红;邓昊
分类号 G10L17/00(2006.01)I 主分类号 G10L17/00(2006.01)I
代理机构 北京国昊天诚知识产权代理有限公司 代理人 顾惠忠
主权项 1、一种说话人识别的方法,其特征在于,所述方法包括以下步骤:获取待识别说话人的语音信号;提取所述语音信号中的基音特征参量、倒谱特征参量及功率谱特征参量;将所述基音特征参量、倒谱特征参量及功率谱特征参量与特征模板中预置的相应语音信号的特征参量分别进行匹配,获取待识别语音信号的综合匹配失真值及综合匹配路径偏差;根据所述综合匹配失真值及综合匹配路径偏差,获取待识别语音信号的最终比对误差;如果所述最终比对误差低于预设综合匹配对比阈值,则确认该说话人。
地址 100083北京市海淀区学院路35号世宁大厦16层