发明名称 |
一种语种识别系统及方法 |
摘要 |
本发明涉及一种语种识别系统及方法,该系统包括:预处理和特征提取模块、生成性音子序列解码模块、N元文法语言语法模型模块及分类器。生成性音子序列解码模块包括:混合高斯模型训练模块、混合高斯模型解码模块及序列平滑模块。该系统及方法将训练语种语音数据通过EM迭代准则,训练生成与该语种数据相对应的混合高斯模型,并根据该混合高斯模型对输入语音的特征进行识别,产生音子序列。本发明的系统及方法利用基于混合高斯模型的生成性音子序列解码模块,避免PPRLM系统中前端音子识别器所需要的大量计算,实现在不损失检测精度的基础上识别速度大幅提高;使用平滑策略,使语音序列具有明显的短时稳定性。 |
申请公布号 |
CN101645269A |
申请公布日期 |
2010.02.10 |
申请号 |
CN200810247575.8 |
申请日期 |
2008.12.30 |
申请人 |
中国科学院声学研究所;北京中科信利技术有限公司 |
发明人 |
颜永红;肖翔;索宏彬;赵庆卫 |
分类号 |
G10L15/18(2006.01)I;G10L15/14(2006.01)I |
主分类号 |
G10L15/18(2006.01)I |
代理机构 |
北京法思腾知识产权代理有限公司 |
代理人 |
杨小蓉 |
主权项 |
1、一种语种识别系统,该系统包括:一预处理和特征提取模块,用于对输入的语音信号做预处理、提取语音信号的特征,并将该特征送入生成性音子序列解码模块;一N元文法语言语法模型模块,用于对送入的音子序列进行似然打分,并将该得分送入分类器;及一分类器,用于将N元文法语言语法模型模块的打分进行比较,最终确定输入的语音信号的语种类别;其特征在于,所述语种识别系统还包括:一生成性音子序列解码模块,用于将训练语种语音数据通过期望最大化EM迭代准则,训练生成与该语种数据相对应的混合高斯模型,并根据该混合高斯模型对输入语音的特征进行识别,产生音子序列,并将该音子序列送入N元文法语言语法模型模块。 |
地址 |
100190北京市海淀区北四环西路21号中国科学院声学研究所 |