发明名称 一种自动检测语言学者朗读错误的方法
摘要 本发明涉及一种用于自动检测语言学者朗读错误的方法,包括:根据朗读语料训练多发音模型;根据参考答案、发音字典、多发音模型构建精简搜索空间;根据参考答案及语言学知识构建朗读语言模型;对输入语音预处理分帧,提取语音特征;采用Viterbi算法在精简搜索空间中搜索一条声学模型得分、语言模型得分及发音得分的累积分数最高的一条发音路径作为识别发音序列;将识别的发音序列与参考答案的发音序列通过动态规划匹配算法对齐,进而得到朗读的多读、漏读、错读结果。本发明中采用隐马尔可夫模型作为声学模型,不需要模板语音,可大大提高使用的便利性,其性能和运行速度也较好。
申请公布号 CN101650886A 申请公布日期 2010.02.17
申请号 CN200810224792.5 申请日期 2008.12.26
申请人 中国科学院声学研究所;北京中科信利技术有限公司 发明人 颜永红;董滨;刘常亮
分类号 G09B19/06(2006.01)I;G09B7/00(2006.01)I;G10L15/14(2006.01)I;G10L15/18(2006.01)I 主分类号 G09B19/06(2006.01)I
代理机构 北京法思腾知识产权代理有限公司 代理人 杨小蓉
主权项 1、一种自动检测语言学习者朗读错误的方法,其特征在于,包含如下步骤:1)前端处理:对输入语音进行预处理,进行特征提取,所提取特征为MFCC特征矢量;2)构建精简搜索空间:将用户所要朗读的内容作为参考答案,并根据参考答案、发音字典、多发音模型和声学模型构建精简的搜索空间;3)构建朗读语言模型:根据参考答案构建用户的朗读语言模型,该语言模型描述用户在朗读该参考语句的时候可能朗读的上下文内容及其概率信息;4)搜索:在搜索空间中,根据声学模型、朗读语言模型和多发音模型搜索得到与输入的特征矢量流最匹配的一条路径,作为用户的实际朗读结果内容,做成识别结果序列;5)对齐:将所述参考答案与识别结果进行对齐,得到用户多读、漏读、错读的检测结果。
地址 100190北京市海淀区北四环西路21号中国科学院声学研究所