发明名称 一种基于动态HMM事件数的提高语音识别准确率的方法
摘要 本发明为大规模孤立词语音识别提供了一种提高识别准确率的方法,针对不同的孤立词建立了隐马尔科夫模型(HMM)参数自适应变化的机制,解决了不同的孤立词因HMM概率模型中事件数相同而识别准确率和识别鲁棒性低的问题。实验结果表明,本发明的方法在稍许增加识别计算量的前提下,有效地提高了大规模孤立词语音识别的准确率。待识别孤立词为5120词时,多次识别准确率的平均值由91%提高到了97.3%;待识别孤立词为10240词时,多次识别准确率的平均值由87%提高到了96.3%。相比于传统的基于统计概率的静态模型的语音识别,采用本发明方法的优势在于针对不同用户自适应的调整识别模型的参数,从而提高识别的准确率。
申请公布号 CN104064179A 申请公布日期 2014.09.24
申请号 CN201410281284.6 申请日期 2014.06.20
申请人 哈尔滨工业大学深圳研究生院 发明人 刘明;王明江
分类号 G10L15/00(2013.01)I;G10L15/14(2006.01)I 主分类号 G10L15/00(2013.01)I
代理机构 深圳市科吉华烽知识产权事务所(普通合伙) 44248 代理人 陈本发;刘显扬
主权项 一种基于动态HMM事件数的提高语音识别准确率的方法,其特征在于,所述方法包括以下步骤:A.给出初始的HMM模型的参数,所述参数包括事件数N和观察符号数M,所述HMM模型采用由左至右无跨越模型结构;其中,初始事件数为40,观察符号数目为32,观察序列个数为20,HMM事件跳转概率矩阵为40×20,由观察序列的个数和观察符号数目可以得到一个20×32的观察序列概率矩阵;初始事件概率矢量是一个1×20的行矩阵B.根据初始HMM事件数、观察序列数以及观察符号数,采用Baum‑Welch算法训练得到的HMM模型进行孤立词语音识别,观察识别的准确率和鲁棒性;C.对于训练所用词库中的每一个词汇,动态地改变HMM事件数N值,步长为2,继续训练得到新的HMM模型,并用训练所用词库中的语音进行孤立词语音识别,待所有词都识别完成后,统计每次改变HMM事件数所得到的识别准确率和识别的概率方差;重复该步骤,找到准确率最大和概率方差最小时所对应的HMM事件数N;D.用户的语音录入后经过特征参数提取,结合步骤C得到的HMM模型参数,经过前向概率计算并给出识别结果后;然后,自动将该用户录入的词汇的语音结合词库中对应词汇的语音进行训练,重新改变HMM的事件数,并计算得到针对特定人的HMM模型及其最佳事件数M。
地址 518000 广东省深圳市南山区西丽镇深圳大学城哈工大校区