发明名称 |
针对儿童的语音识别方法及装置 |
摘要 |
本发明提供了一种针对儿童的语音识别方法及装置。其中,该方法包括:建立声学模型和语言模型;接收所述儿童的语音信号,并对所述语音信号进行前端处理;获取语音信号的声学特征;通过所述声学模型和所述语言模型对所述语音信号的声学特征进行解码搜索,以获得识别文本;对所述识别文本进行语义理解处理,以获得语义理解结果;其中所述建立声学模型包括:对所述语音语料库中的全部语音语料进行特征提取处理,并在所述特征提取处理过程中加入声道长度归一化技术。通过本发明的语音识别方法,能够根据儿童声道短、发音速度变化大、无意义助声词较多等发音特点更有效地解析儿童的语言指令,大幅度提高儿童语音识别率。 |
申请公布号 |
CN103956162A |
申请公布日期 |
2014.07.30 |
申请号 |
CN201410145971.5 |
申请日期 |
2014.04.11 |
申请人 |
上海元趣信息技术有限公司 |
发明人 |
张峰;赖伟;吴义坚 |
分类号 |
G10L15/02(2006.01)I;G10L15/05(2013.01)I;G10L15/26(2006.01)I |
主分类号 |
G10L15/02(2006.01)I |
代理机构 |
北京智汇东方知识产权代理事务所(普通合伙) 11391 |
代理人 |
薛峰;范晓斌 |
主权项 |
一种针对儿童的语音识别方法,包括:通过已知的语音语料库和文本语料库分别建立声学模型和语言模型;接收所述儿童的语音信号,并对所述语音信号进行前端处理;对经过所述前端处理的所述语音信号进行特征提取处理,以获取语音信号的声学特征;通过所述声学模型和所述语言模型对所述语音信号的声学特征进行解码搜索,以获得识别文本;对所述识别文本进行语义理解处理,以获得语义理解结果;其中所述通过已知的语音语料库建立声学模型包括:对所述语音语料库中的全部语音语料进行特征提取处理,并在所述特征提取处理过程中加入声道长度归一化技术,以获得所述全部语音语料的声学特征;根据所述全部语音语料的声学特征进行建模,以获得所述声学模型。 |
地址 |
201203 上海市嘉定区安亭镇曹安公路5128号1幢1层1031室 |