发明名称 基于分类器融合的汉语方言自动辨识方法
摘要 本发明公开一种基于分类器融合的汉语方言自动辨识方法,分为汉语方言语音特征提取、方言模型匹配打分,分类矢量提取及后端分类四个步骤。采用两级特征提取方式,将高斯混合模型(GMM)作为高级特征提取器加以使用。在计算的过程中将语音特征送入到含有方言语音先验知识的高斯混合模型中进行打分,并对所得打分进行归一化和差分计算,形成具有高类间差异度和类内聚合度的分类矢量。将其送入到后端支撑矢量机(SVM)分类器中进行分类。融合GMM在数据分布拟合,SVM在分类面建模时的技术优势,最终实现对汉语方言所属方言区种类的辨识。本发明能够稳定可靠的用于汉语电话方言语音等的辨识任务,准确率较高。
申请公布号 CN103474061A 申请公布日期 2013.12.25
申请号 CN201310416173.7 申请日期 2013.09.12
申请人 河海大学 发明人 朱贺;高红民;王慧斌
分类号 G10L15/02(2006.01)I;G10L15/18(2013.01)I 主分类号 G10L15/02(2006.01)I
代理机构 南京苏高专利商标事务所(普通合伙) 32204 代理人 李玉平
主权项 一种基于分类器融合的汉语方言自动辨识方法,其特征在于:选用GMM和SVM为融合对象,输入汉语方言信号进行语音特征提取,在新分类特征的提取过程中,首先利用已知的训练样本集合训练方言的GMM;然后将语音数据输入到设计好的各种方言的GMM中,对语音基元进行似然打分,组成分数矢量[P(xi|μ1Σ1)P(xi|μ2Σ2)…P(xi|μNΣN)],实现从原始语音特征空间到分数空间的映射;其次对该分数矢量进行归一化处理和差分运算;随后,基于训练分类矢量训练SVM分类器。
地址 211100 江苏省南京市江宁区佛城西路8号