发明名称 一种提高汽车声控系统语音识别率的方法
摘要 本发明公开一种提高汽车语音识别系统识别率的方法,包括以下步骤:1、为汽车声控系统配置语音提示模块,输出语音提示信号对汽车音响系统播放的娱乐信号实施分时控制;2、汽车声控系统的语音识别模块还配置采用分级输入和分级识别的语音指令分级方法的流程;3、汽车声控系统的语音识别模块还配置采用分级语音指令鲁棒性识别方法的流程。本发明方法有效改善影响汽车语音识别系统识别率的语音差异因素,保持预期的准确识别率,提高汽车语音识别系统语音识别的可靠性和稳定性。本发明方法可以应用于各自档次的汽车的电器声控系统。
申请公布号 CN102332265B 申请公布日期 2014.04.16
申请号 CN201110164289.7 申请日期 2011.06.20
申请人 浙江吉利汽车研究院有限公司;浙江吉利控股集团有限公司 发明人 张方伟;邓健;陈冰;朱祝阳;丁武俊;熊想涛;陈文强;潘之杰;赵福全
分类号 G10L15/26(2006.01)I;G10L15/08(2006.01)I;B60R16/037(2006.01)I 主分类号 G10L15/26(2006.01)I
代理机构 杭州杭诚专利事务所有限公司 33109 代理人 尉伟敏;王鑫康
主权项 一种提高汽车声控系统语音识别率的方法,它包括以下步骤:步骤一、为共用汽车音响系统的放音部件的汽车声控系统配置语音提示模块,语音提示模块输出语音提示信号能对汽车音响系统播放的娱乐信号实施分时控制;步骤二、汽车声控系统的语音识别模块还配置采用分级输入和分级识别的语音指令分级方法的流程;通过将语音指令分级,使在同一级的语言指令中尽量少出现相同的字或发音相近的字,这样就能够大大提高语音识别可靠性;所述语音指令分级方法流程包括以下步骤:(1)通过按键或非按键,启动汽车声控系统;(2)语音提示模块输出语音提示信号“欢迎使用第一级语音指令”,包括“小秘书欢迎您”,语音提示信号通过音响系统的放音部件播放“第一级关键词词组”的内容;(3)语音声控系统采集车乘人员发送的“第一级关键词”语音信号;(4)语音识别模块对 “第一级关键词”语音信号作语音识别,完成对第一级语音指令的确认;若判断为“否”,判定接收的语音不是第一级语音指令,返回(3)等待采集车乘人员发送的“第一级关键词”语音;若判断为“是”,判定接收的语音是第一级语音指令,执行下一步流程(5);(5)语音提示模块根据第一级关键词的不同关键词,输出第二级语音指令的不同语音提示信号:“继续使用第二级语音指令”,包括“可用指令开、停或关”,“可用指令升、停或降”,语音提示信号通过音响系统的放音部件播放“第二级关键词词组”的相应语音提示内容;(6)语音声控系统采集车乘人员发送的“第二级关键词”语音信号;(7)语音识别模块对 “第二级关键词”作语音识别,完成对第二级语音指令的确认;若判断为“否”,判定接收的语音不是第二级语音指令,返回(6)等待采集车乘人员发送的“第二级关键词”语音;若判断为“是”,判定接收的语音是第二级语音指令,执行下一步流程(8);(8)语音声控系统输出由第一级语音指令、第二级语音指令组合的控制信号,由系统控制模块完成对应声控电器的控制;(9)结束流程;步骤三、汽车声控系统的语音识别模块还配置采用分级语音指令鲁棒性识别方法的流程;用于实现语音不精确的条件下,使语音识别模块能保持预期的识别概率,从而能够大大提高汽车声控系统语音识别的识别率;所述分级语音指令鲁棒性识别的方法包括以下步骤: (1)语音声控系统初始化;1)定义并建立相近于语音指令精确拼音模型的鲁棒性非精确拼音模型数据库简称语音指令鲁棒性拼音模型数据库; 2)确定鲁棒性拼音模型数据库的非精确相近性准则,包括a. 将翘舌音的语音拼音与非翘舌音的语音拼音判定为相近;b. 将前鼻音的语音拼音与非前鼻音的语音拼音判定为相近; c. 将后鼻音的语音拼音与非后鼻音的语音拼音判定为相近; 3)定义第一级语音指令的第一级关键词词组,构建第一级关键词词组的各个关键词标准语音精确拼音模型及其鲁棒性拼音模型;建立包含第一级关键词词组的语音指令第一级关键词子库简称第一级关键词子库,每个“第一级关键词”拼音模型包括一个精确拼音模型与若干个相近的鲁棒性拼音模型;4)定义第二级语音指令的第二级关键词词组,构建第二级关键词词组的关键词标准语音精确拼音模型及其鲁棒性拼音模型;建立包含第二级关键词词组的语音指令第二级关键词子库简称第二级关键词子库,每个“第二级关键词”拼音模型包括一个精确拼音模型与若干个相近的鲁棒性拼音模型;(2)语音识别识别模块接收指令人发出的第一级语音指令;(3)语音识别模块先调用“第一级关键词子库”作语音指令鲁棒性匹配识别,与每个第一级关键词的一个精确拼音模型与若干个相近的鲁棒性拼音模型作比对,以“或”符合判定为“匹配”;若判定为“否”,返回步骤(2);若判定为“是”,转步骤(4);(4)输出匹配的第一级语音指令的关键词代码;(5)语音识别识别模块接收指令人发出的第二级语音指令;(6)语音识别模块先调用“第一级关键词子库”作语音指令鲁棒性匹配识别,与每个第一级关键词的一个精确拼音模型与若干个相近的鲁棒性拼音模型作比对,以“或”符合判定为“匹配”;若判定为“否”,返回步骤(5);若判定为“是”,转步骤(7);(7)输出匹配的第二级语音指令的动作关键词代码;语音识别模块后调用“第二级关键词子库”作语音指令鲁棒性匹配识别,与每个第二关键词的一个精确拼音模型与若干个相近的鲁棒性拼音模型作比对,以“或”符合,则判定为“匹配”,输出该第二关键词的代码值;(8)匹配的第一级与第二级语音指令关键词作组合处理:第一级关键词的代码值与第二级关键词的代码值组合,构成组合语音指令代码;(9)输出匹配的组合语音指令代码的控制信号。
地址 317000 浙江省台州市临海市城东闸头