发明名称 |
嵌入式语音识别系统的自动语音识别处理方法 |
摘要 |
一种嵌入式语音识别系统的自动语音识别处理方法。用于智能信息处理技术领域。本发明由前端处理、实时识别、后端处理以及模板训练四个部分组成,采用自适应端点检测技术提取有声段,采用同步方式识别输入语音,应用支持向量机算法实现快速的非命令语音拒识,提高识别的可靠性和实用性,采用多段矢量量化方法训练语音模板,并辅以最小分类错误/泛化概率下降(MCE/GPD)区别性训练,优化语音模板提高识别性能。本发明所用声学模型的存储空间小,有效地提高了系统的识别率,识别率达95%以上,算法压力小,存储空间小,拒识率高于8O%。 |
申请公布号 |
CN1300763C |
申请公布日期 |
2007.02.14 |
申请号 |
CN200410066796.7 |
申请日期 |
2004.09.29 |
申请人 |
上海交通大学 |
发明人 |
朱杰;蔡铁 |
分类号 |
G10L15/06(2006.01);G10L15/12(2006.01);G10L11/02(2006.01) |
主分类号 |
G10L15/06(2006.01) |
代理机构 |
上海交达专利事务所 |
代理人 |
王锡麟;王桂忠 |
主权项 |
1、一种嵌入式语音识别系统的自动语音识别处理方法,其特征在于,由前端处理、实时识别、后端处理以及模板训练四个部分组成,采用自适应端点检测技术提取有声段,采用同步方式识别输入语音,应用支持向量机算法实现快速的非命令语音拒识,提高识别的可靠性和实用性,采用多段矢量量化方法训练语音模板,并辅以最小分类错误/泛化概率下降区别性训练,优化语音模板提高识别性能,其中模板训练的具体过程如下:模板训练采用基于动态规划算法的多段矢量量化方法,先将属于同一类的训练语句按照动态规划算法在时间上分成几段,然后每段中用LBG方法生成一个标准矢量量化码本,多段矢量量化模板包含了训练集中所有说话人的语音特征,并且保留了语音的时序特征,在多段矢量量化模板基础之上,针对识别所采用的动态时间弯折识别技术,应用最小分类错误/泛化概率下降区别性训练算法从最小误识率的角度提高模板的区分能力,经过区别性训练后,得到更为优化的模板。 |
地址 |
200240上海市闵行区东川路800号 |