发明名称 语音识别装置和语音识别方法
摘要 语音识别装置(1)在内部识别部(7)中,对输入语音(2)的语音数据(4)进行使用了声学模型(9)的识别处理,求出内部识别结果(10)和声学似然度。读音赋予部(12)取得由外部识别部(19)对输入语音(2)的语音数据(4)进行识别处理后的外部识别结果(11),对该语音数据(4)赋予读音,重新对照部(15)使用声学模型(9),求出外部识别结果(11)的声学似然度,作为重新对照结果(16)。结果确定部(17)对内部识别结果(10)的声学似然度、和重新对照结果(16)所包含的外部识别结果(11)的声学似然度进行比较,确定最终识别结果(18)。
申请公布号 CN105009206A 申请公布日期 2015.10.28
申请号 CN201380074221.7 申请日期 2013.03.06
申请人 三菱电机株式会社 发明人 花泽利行
分类号 G10L15/32(2006.01)I;G10L15/187(2006.01)I;G10L15/197(2006.01)I;G10L15/30(2006.01)I 主分类号 G10L15/32(2006.01)I
代理机构 北京三友知识产权代理有限公司 11127 代理人 李辉;黄纶伟
主权项 一种语音识别装置,其得到对输入语音数据进行识别处理后的内部识别结果、和通过存在于外部的1个以上的外部识别部对该输入语音数据进行识别处理后的外部识别结果,确定最终的识别结果,其特征在于,所述语音识别装置具有:声学模型,其是对语音的特征量进行模型化而得到的;语言模型,其储存有作为语音识别装置的识别对象的1个以上的词汇的标写和读音;读音词典,其储存有所述识别对象和所述识别对象外的词汇的标写与其读音的对;分析部,其分析所述输入语音数据来计算特征向量;内部识别部,其使用所述声学模型,进行所述分析部计算出的所述特征向量和所述语言模型所储存的各词汇之间的模式对照,计算声学似然度,将该声学似然度高的上位的1个以上的词汇的标写、读音和声学似然度作为内部识别结果输出;读音赋予部,其取得通过所述外部识别部对所述输入语音数据进行识别处理后的外部识别结果,使用所述读音词典,赋予针对该外部识别结果的读音,输出由该外部识别结果及其读音构成的读音赋予结果;重新对照部,其使用所述声学模型,进行所述分析部计算出的所述特征向量和所述读音赋予部输出的所述读音赋予结果之间的模式对照,计算针对所述外部识别结果的声学似然度;以及结果确定部,其对所述内部识别结果的声学似然度和所述外部识别结果的声学似然度进行比较,确定最终的识别结果。
地址 日本东京都