发明名称 一种声纹识别方法
摘要 本发明提出的声纹识别方法,属于基于生物特征的身份识别技术领域。该方法首先从多个说话人的声音波形中提取声学特征,形成多个说话人的特征矢量序列;根据特征矢量序列构建一个通用背景模型,根据通用背景模型,构建高斯混合树,并训练每个说话人的概率模型;从待识别的语音中提取声学特征,形成待识别语音的特征矢量序列,并重新排序,得到重排序特征矢量序列,为重排序特征矢量序列中的每个矢量,从高斯混合树中挑选核心的高斯混合,并计算待识别语音的重排序特征矢量分别与每个说话人概率模型匹配的概率似然分数;计算待识别语音的重排序特征矢量分别与每个说话人概率模型匹配的概率似然分数的总和,并进行剪枝,取分数最大的为识别结果。
申请公布号 CN1302456C 申请公布日期 2007.02.28
申请号 CN200510059913.1 申请日期 2005.04.01
申请人 郑方 发明人 郑方;熊振宇;宋战江
分类号 G10L17/00(2006.01);G10L15/08(2006.01) 主分类号 G10L17/00(2006.01)
代理机构 北京清亦华知识产权代理事务所 代理人 罗文群
主权项 1、一种声纹识别方法,其特征在于该方法包括以下步骤:(1)从多个说话人的声音波形中提取声学特征,形成多个说话人的特征矢量序列;(2)根据上述特征矢量序列构建一个通用背景模型;(3)根据上述通用背景模型,构建高斯混合树;(4)根据上述通用背景模型,训练每个说话人的概率模型;(5)从待识别的语音中提取声学特征,形成待识别语音的特征矢量序列,将该特征矢量重新排序,得到重排序特征矢量序列,其方法包括以下步骤;(a)在特征矢量序列X={X1,...,XT}中,以间隔n从中挑选出矢量,形成矢量序列O={X1,X1+n,X1+2n,...},建立序列Y,使Y=O;(b)在序列Y中从左往右依次取相邻矢量的序号的算术平均值,若离该平均值最近的序号对应的矢量不在上述Y中,则从X中取出该矢量加入到一个新的矢量序列Q中;(c)将上述得到的矢量序列Q添加到矢量序列Y的后面;(d)重复步骤(b)和(c),直到矢量序列X={X1,...,XT}中所有矢量全部重排到矢量序列Y中;(6)为上述重排序特征矢量序列中的每个矢量,从上述构建的高斯混合树中挑选核心的高斯混合;(7)根据上述核心高斯混合,计算上述待识别语音的重排序特征矢量分别与每个说话人概率模型匹配的概率似然分数;(8)计算上述待识别语音的重排序特征矢量分别与每个说话人概率模型匹配的概率似然分数的总和,并进行剪枝,取分数最大的为识别结果。
地址 100084北京市海淀区清华园清华大学西14-4-202