发明名称 一种基于江淮语系的语音识别系统
摘要 本发明公开了一种基于江淮语系的语音识别系统。本发明提供的这种基于江淮语系的语音识别系统,由训练模块、建模模块和应用端模块组成。所述训练模块通过对输入的江淮语系训练语音以及对应的语音文本进行训练,通过所述建模模块应用隐马尔可夫模型(HMM)的工具包进行建模,并利用建立好的模型来完成所述应用端模块的设计;需要转换的语音信号直接送入所述应用端模块,由应用端模块进行语音识别,并转换成文本文档。本系统在实现语音识别的基础上,更加强化了对江淮大部分地区方言的识别。
申请公布号 CN103839546A 申请公布日期 2014.06.04
申请号 CN201410116258.8 申请日期 2014.03.26
申请人 合肥新涛信息科技有限公司 发明人 刘亚斌;许林冲;陈良
分类号 G10L15/14(2006.01)I;G10L15/06(2013.01)I 主分类号 G10L15/14(2006.01)I
代理机构 代理人
主权项 一种基于江淮语系的语音识别系统,其特征在于,它包括训练模块、建模模块和应用端模块,所述建模模块是训练模块与应用端模块连接的桥梁,它们之间按照先训练(训练模块)再建模(建模模块)最后应用(应用端模块)的顺序进行工作,上述各单元还有以下特征:(1)所述训练模块,由训练语音、语音对应的转录文本和训练工具组成,用于建立语音与文本之间的联系,为建模准备素材,训练语音与文本之间采用多对一的方式即江淮语系的发音与普通话发音对应同一个转录文本;(2)所述建模模块,通过训练模块准备的素材应用隐马尔可夫模型(HMM)的工具包并配合模糊音识别技术建立准确合理的模型;(3)所述应用端模块,由语音识别器和语境二次识别器组成,语音识别器根据建模模块建立的模型来完成设计,用于对送入语音的首次识别,语境二次识别器由大量的词库组成,将首次识别后的语音根据前后文的语境进行二次识别。
地址 233100 安徽省合肥市高新区天通路14号软件园4号楼210室