发明名称 | 声音识别装置 | ||
摘要 | 本发明所涉及的声音识别装置利用对话边切换识别对象的词汇边进行声音识别,所述声音识别装置包括:静态生成部,该静态生成部对于成为识别对象的词汇数量为阈值以上的词汇,预先生成识别词典;动态生成部,该动态生成部对于识别对象的词汇数量小于阈值的词汇,在对话情境中生成识别词典;以及声音识别部,该声音识别部参照由静态生成部或动态生成部所生成的识别词典来对输入声音进行声音识别。本发明能缩短与使用者对话过程中生成识别词典所需的时间,且能降低将预先生成的识别词典进行存储所需的存储区域的使用容量。 | ||
申请公布号 | CN102770910B | 申请公布日期 | 2015.10.21 |
申请号 | CN201080064456.4 | 申请日期 | 2010.03.30 |
申请人 | 三菱电机株式会社 | 发明人 | 山崎道弘;丸田裕三 |
分类号 | G10L15/22(2006.01)I | 主分类号 | G10L15/22(2006.01)I |
代理机构 | 上海专利商标事务所有限公司 31100 | 代理人 | 李玲 |
主权项 | 一种声音识别装置,该声音识别装置利用对话边切换识别对象的词汇边进行声音识别,其特征在于,包括:静态生成部,该静态生成部对于成为识别对象的词汇数量为阈值以上的词汇,预先生成识别词典;动态生成部,该动态生成部对于识别对象的词汇数量小于所述阈值的词汇,在对话情境中生成识别词典;以及声音识别部,该声音识别部参照由所述静态生成部或所述动态生成部所生成的识别词典来对输入声音进行声音识别,若所述静态生成部生成包含对话情境中被选作识别对象的词汇、且包含的识别对象的词汇数量的比率为规定比例以上的识别词典,则所述动态生成部不在所述对话情境中生成关于该词汇的识别词典,所述声音识别部参照由所述静态生成部所生成的该识别词典来对输入声音进行声音识别,将识别的似然度较高的前几个识别结果候选中的、本次的识别对象的词汇中所包含的识别结果候选作为识别结果进行输出。 | ||
地址 | 日本东京 |