发明名称 声音识别服务器综合装置以及声音识别服务器综合方法
摘要 提供以最佳形式对通用声音识别服务器的声音识别结果和专用声音识别服务器的声音识别结果进行综合从而最终错误较少的声音识别功能。使用包含在用户辞典数拥中的语句来构建专用的声音识别服务器(108),并且使用这些数拥来事前评价通用的声音识别服务器(106)的性能。以该评价结果为基础,对从专用以及通用的声音识别服务器得到的识别结果,将采用哪个、对它们进行怎样的加权才能得到最佳的识别结果作为结果综合用参数(118),以数据库的形式保持。在识别执行时,通过将专用以及通用的声音识别服务器进行识别的识别结果与结果综合用参数(118)进行比较,由此来获得最佳的识别结果。
申请公布号 CN104221078B 申请公布日期 2016.11.02
申请号 CN201380018950.0 申请日期 2013.04.03
申请人 歌乐株式会社 发明人 大渊康成;本间健
分类号 G10L15/32(2013.01)I;G10L15/30(2013.01)I 主分类号 G10L15/32(2013.01)I
代理机构 中科专利商标代理有限责任公司 11021 代理人 赵琳琳
主权项 一种声音识别服务器综合装置,是对用于用户使用声音来进行操作的终端装置、与识别声音数据并返回其结果的声音识别服务器之间进行中继的装置,其特征在于,所述声音识别服务器综合装置具备:基于用户所登记的语句或用户经常使用的语句的列表来学习并保存识别结果综合用参数的综合方式学习部;从所述终端装置接收用户为了声音识别而刻意发出的声音的数据的单元;将所述接收到的声音数据发送给通用声音识别服务器以及专用声音识别服务器的单元;接收所述通用声音识别服务器以及专用声音识别服务器对所述声音数据进行识别的识别结果的单元;将所述通用声音识别服务器以及专用声音识别服务器进行识别的识别结果与所述保存的识别结果综合用参数进行比较来选择最佳的识别结果的识别结果综合部;将所述选择的识别结果发送给所述终端装置的单元;从所述终端装置接收用户所登记的语句或用户经常使用的语句的列表的单元;以所述接收到的语句为基础来生成合成声音的声音合成部;将所述生成的合成声音发送给所述通用声音识别服务器以及专用声音识别服务器的单元;和接收所述通用声音识别服务器以及专用声音识别服务器对所述合成声音进行识别的识别结果的单元,所述综合方式学习部将成为所述合成声音的基础的语句和所述识别结果一起进行解析,学习并保存识别结果综合用参数。
地址 日本国埼玉县