发明名称 说话人识别装置、程序及说话人识别方法
摘要 为了能够实现精度高的说话人识别,使用两个特征参数时间序列A、B的各自的Δ间距时间序列,通过DP匹配单元(11)求音韵性距离的总和最小的最佳匹配序列F,使用该最佳匹配序列和两个特征参数时间序列A、B的各自的倒谱系数时间序列,通过说话人之间距离计算单元求个人性距离的总和,基于该总和,通过辨认单元进行说话人的辨认。由此,兼顾音韵分解性能和说话人分解性能,可以确保稳定的识别性能,因此可以实现精度高的说话人识别。
申请公布号 CN1914667A 申请公布日期 2007.02.14
申请号 CN200580003955.1 申请日期 2005.05.31
申请人 东芝泰格有限公司 发明人 柿野友成;伊久美智则
分类号 G10L17/00(2006.01);G10L15/02(2006.01);G10L15/10(2006.01);G10L15/12(2006.01) 主分类号 G10L17/00(2006.01)
代理机构 北京市柳沈律师事务所 代理人 邵亚丽;李晓舒
主权项 1.一种说话人识别装置,基于第一语音特征参数时间序列和第二语音特征参数时间序列的时间序列间的距离,进行说话人的识别,其特征在于,所述说话人识别装置包括:设定使所述第一语音特征参数时间序列以及所述第二语音特征参数时间序列的各语音特征参数相互建立对应的匹配序列,使用各自的第一语音特征参数组,按照所述匹配序列求各语音特征参数间的第一距离,并求该第一距离的总和的部件;求最佳匹配序列以使所述第一距离的总和成为最小的部件;使用所述第一语音特征参数时间序列以及所述第二语音特征参数时间序列各自的第二语音特征参数组,按照所述最佳匹配序列,求各语音特征参数间的第二距离,并求该第二距离的总和的部件;以及基于求出的所述第二距离的总和进行说话人的辨认的部件。
地址 日本东京都