发明名称 一种基于模型生长聚类的说话人快速识别方法及系统
摘要 本发明公开一种基于模型生长聚类的说话人快速识别方法及系统,所述方法包括模型训练和模型识别,模型训练包括采集包括说话人在内的多人的声纹信号;对各声纹信号进行预处理并提取声纹特征参数,形成多个模型;采用模型生长聚类算法对所有的模型进行自适应归类;模型识别包括采集说话人的语音信号进行预处理并提取声纹特征参数,计算待识别语音信号的特征参数到各类代表的似然度,以似然度最大原则选择所属的类,进而与选择的类中所有模型计算似然得分,得分最高的模型即为识别结果。本发明方法无需将待识别语音特征与所有模型进行匹配,因此匹配时间短、实时性好,能够很好地适应大规模的模型库。
申请公布号 CN105096955A 申请公布日期 2015.11.25
申请号 CN201510563935.5 申请日期 2015.09.06
申请人 广东外语外贸大学 发明人 张晶;陈晓梅;郑党
分类号 G10L17/02(2013.01)I;G10L17/06(2013.01)I 主分类号 G10L17/02(2013.01)I
代理机构 广州粤高专利商标代理有限公司 44102 代理人 禹小明
主权项 一种基于模型生长聚类的说话人快速识别方法,其特征在于,包括模型训练和模型识别;模型训练包括以下步骤:S1:采集包括说话人在内的多人的声纹信号;S2:对各声纹信号进行预处理,其预处理过程依次包括预加重、分帧、加窗和端点检测;S3:对各声纹信号进行声纹特征参数提取,形成多个模型;S4:采用模型生长聚类算法对所有的模型进行自适应归类,自适应归类过程包括初始化类代表、类代表审定、类代表推举;模型识别包括以下步骤:S5:采集说话人的语音信号;S6:对待识别的语音信号进行预处理并提取声纹特征参数;S7:计算待识别语音信号的特征参数到各类代表的似然度,以似然度最大原则选择所属的类,进而与选择的类中所有模型计算似然得分,得分最高的模型即为识别结果。
地址 510006 广东省广州市番禺区小谷围广州大学城