发明名称 一种用于口语练的学生朗读作业的评判方法
摘要 本发明公开了一种用于口语练的学生朗读作业的评判方法,包括:利用语言模型建立指定文本对应的第一课文模型L1,并根据指定文本对应的混淆词表和混淆发音表将第一课文模型L1制作成带有竞争能力的第二课文模型L2,通过语音采集器采集用户朗读的语音文件,对声道进行重估得到重估语音文件,通过模型L2引导语音识别器对重估文件进行识别,得到识别文本,并与指定文本进行带有置信度加权的对比及评判。通过本发明的用于口语练的学生朗读作业的评判方法,可以对采集的语音文件进行准确而高效的识别及评判。
申请公布号 CN102930866B 申请公布日期 2014.05.21
申请号 CN201210438443.X 申请日期 2012.11.05
申请人 广州市神骥营销策划有限公司 发明人 肖剑
分类号 G10L15/14(2006.01)I 主分类号 G10L15/14(2006.01)I
代理机构 广州市越秀区哲力专利商标事务所(普通合伙) 44288 代理人 汤喜友
主权项 一种用于口语练习的学生朗读作业的评判方法,其特征在于,包括步骤:利用语言模型建立指定文本对应的第一课文模型L1,并根据指定文本对应的混淆词表和混淆发音表将第一课文模型L1制作成带有竞争能力的第二课文模型L2,其中,混淆词表和混淆发音表中的混淆信息分别为指定文本中容易产生混淆的词及对应混淆词的信息及容易产生混淆的发音与对应混淆发音的信息;通过语音采集器采集用户朗读的语音文件,对声道进行重估后得到重估语音文件;通过第二课文模型L2引导语音识别器对重估语音文件进行识别,获得识别文本;将识别文本与指定文本进行带有置信度加权的加权对比和评判,得到对比及评判结果;第一课文模型L1由通用模型和专用模型采用PPL最大化方式插值而成,专用模型采用指定文本中的句子生成,用于识别指定文本内部的单词,通用模型采用新闻、小说、微博及专用名词四种语料中的至少一种训练而成,并裁剪成10M‑100M大小,用于识别指定文本以外的单词。
地址 510000 广东省广州市荔湾区逢源路128号1405房
您可能感兴趣的专利