发明名称 一种基于简单直接度量学算法的说话人识别方法
摘要 本发明提供一种基于简单直接度量学算法的说话人识别方法,包括:采集多个说话人的语音样本,提取所有样本的i‑vector,采用LDA或WCCN方法进行信道补偿处理,并进行长度规整,形成训练样本集;根据训练样本集的i‑vector和说话人身份,构造相似样本对集和非相似样本对集;采用KISS算法,在相似样本对集和非相似样本对集上训练得到度量矩阵;对于新的两条语音,先将它们的i‑vector提取出来,采用LDA或WCCN方法进行信道补偿处理,并进行长度规整,使用前面计算出来的度量矩阵,计算出两个i‑vector之间的马氏距离,并和阈值进行比较,判定这两条新的语音是否属于同一个说话人。本发明所得到的马氏距离度量矩阵更能真实反映样本空间的相似性和区分性,从而提高说话人识别系统的性能。
申请公布号 CN105931646A 申请公布日期 2016.09.07
申请号 CN201610281884.1 申请日期 2016.04.29
申请人 江西师范大学 发明人 雷震春;杨印根;朱明华
分类号 G10L17/00(2013.01)I;G10L17/04(2013.01)I 主分类号 G10L17/00(2013.01)I
代理机构 北京众合诚成知识产权代理有限公司 11246 代理人 熊思智
主权项 一种基于简单直接度量学习算法的说话人识别方法,其特征在于,该方法包括以下步骤:采集多个说话人的语音样本,提取所有样本中的i‑vector;采用LDA或WCCN方法进行信道补偿处理所有样本中的i‑vector,并进行长度规整,形成训练样本集;构造基于训练样本集的i‑vector和说话人身份的相似样本对集和非相似样本对集;采用KISS算法,在相似样本对集和非相似样本对集上训练得到度量矩阵;对于新的两条语音,将它们的i‑vector经过以上所述提取、信道补偿处理和长度规整的处理后,基于之前计算出来的度量矩阵,计算两个i‑vector之间的马氏距离;将所得的马氏距离和阈值进行比较,基于比较结果,对这两条新的语音是否属于同一说话人作出判断。
地址 330022 江西省南昌市紫阳大道99号江西师范大学瑶湖校区