基于语音识别专用芯片的非特定人语音识别、语音提示方法,申请号CN00105548.8-传众专利搜索

发明名称	基于语音识别专用芯片的非特定人语音识别、语音提示方法
摘要	本发明属于语音技术领域，涉及基于语音识别专用芯片的非特定人语音识别、语音提示方法。包括：非特定人语音识别的预先训练、语音识别参数提取、非特定人语音命令的识别、非特定人语音识别的说话人自适应学、语音提示。本识别方法具有方法简单、识别率高、稳健性好等特点。构成的系统可以用于玩具控制、声控拨号、智能性家用电器、学机、以及生产环节的控制系统中。
申请公布号	CN1141696C	申请公布日期	2004.03.10
申请号	CN00105548.8	申请日期	2000.03.31
申请人	清华大学	发明人	刘加;李晓宇;史缓缓;刘润生
分类号	G10L15/00	主分类号	G10L15/00
代理机构	北京清亦华专利事务所	代理人	廖元秋
主权项	1、一种基于语音识别专用芯片的非特定人语音识别、语音提示方法，包括A/D采样，频谱整形加窗预加重处理，特征参数提取，端点检测，语音识别模板训练，语音识别模板匹配，识别结果输出，以及语音提示，其特征在于，具体包括以下步骤：A、非特定人语音识别的预先训练：训练过程要求有大量的语音库，训练过程在PC机上完成，将训练后的模板存入芯片中，其训练方法包括：采用基于多项式的分类方法；识别模型的参数用多项式的系数来表示；通过多项式来逼近后验概率；模型参数通过线性方程组的优化计算方法求得；B、语音识别参数提取：(1)语音信号输入后采用A/D进行采样，成为原始的数字语音，采用电平增益控制；(2)对所说的原始数字语音信号进行频谱整形及分帧加窗处理；(3)对所说的分帧语音的特征进行语音特征提取，主要特征参数采用线性预测倒频谱系数(LPCC)，并存储用于后面动态分段和模板提取；(4)使用语音信号的过零率与短时能量特征进行端点检测，去除无声区的语音帧；C、非特定人语音命令的识别：识别过程采用两级识别结构，分为粗识别和精识别。对不容易混淆的命令粗识别就可以得出结果，对易于混淆的命令通过更精细的模型进行识别；D、非特定人语音识别的说话人自适应学习：对说话人具有地方口音或说话不规范时，识别系统会造成误判，采用说话人自适应方法对识别模板进行调整；所说的自适应调整方法采用最大后验概率方法，通过迭代方法逐步修正识别模板参数；E.语音提示：语音提示使用语音合成与语音编解码技术，语音合成模型参数分析提取过程在计算机上完成，然后存储在芯片中用于语音合成，语音合成模型使用多脉冲语音合成模型。
地址	100084北京市海淀区清华园