发明名称 可配置分散型语音辨认系统
摘要 一种可配置分散型语音辨认系统,包含:可配置分散型语音辨认协定及可配置分散型语音辨认伺服器。其中,可配置分散型语音辨认协定用以规定客户端语音行动装置的语音资料及配置资料的传送格式,以形成一信息封包,而可配置分散型语音辨认伺服器,则用以接收来自客户端语音行动装置的信息封包,并根据配置资料进行语音辨认参数的调整,并将语音辨认后的结果传回该客户端语音行动装置。
申请公布号 TW567465 申请公布日期 2003.12.21
申请号 TW091119932 申请日期 2002.09.02
申请人 财团法人工业技术研究院 发明人 杨寅宾;陈柏诚;王建杰
分类号 G10L19/00 主分类号 G10L19/00
代理机构 代理人
主权项 1.一种可配置分散型语音辨认系统,包含:一可配置分散型语音辨认协定,用以规定一客户端装置的语音资料及配置资料的传送格式,以形成一信息(message)封包;及一可配置分散型语音辨认伺服器,用以接收来自该客户端装置的该信息封包,该可配置分散型语音辨认伺服器根据该配置资料进行语音辨认参数的调整,并将语音辨认处理后所产生的结果传回该客户端装置。2.如申请专利范围第1项所述之可配置分散型语音辨认系统,其中上述之客户端装置为一行动通讯装置。3.如申请专利范围第1项所述之可配置分散型语音辨认系统,其中上述之可配置分散型语音辨认伺服器包含:一解析器,用以解析该信息封包,以取得该配置资料及该语音资料;一配置控制器,用以处理该配置资料,并根据该配置资料产生一辨认调整参数,该辨认调整参数用以于该可配置分散型语音辨认系统于进行语音辨认时,根据该客户端装置的计算、记忆、通讯能力及频宽配置该可配置分散型语音辨认伺服器的资源;一可配置分散型语音辨认引擎,用以辨识由该解析器传来的该语音资料,并接受该配置控制器的配置;一历史日志,用以纪录该分散型语音辨认伺服器中所产生的历史资料;及一诊断工具组,根据该历史资料产生一诊断参数用以调校该可配置分散型语音辨认引擎。4.如申请专利范围第1项所述之可配置分散型语音辨认系统,其中上述之分散型语音辨认伺服器更包含一可配置对话系统,该可配置对话系统根据该可配置分散型语音辨认引擎的辨认结果,分析产生于一对话中可能出现的字汇组,并供该可配置分散型语音辨认引擎于下次辨认时使用,以增进辨识率及辨识速度。5.如申请专利范围第4项所述之可配置分散型语音辨认系统,其中上述之历史日志用以纪录该配置控制器、该分散型语音辨认引擎以及该可配置对话系统所产生的结果。6.如申请专利范围第1项所述之可配置分散型语音辨认系统,其中上述之配置资料,系选自于由一说话者声音轮廓、声音环境、通道效应、该客户端装置规格以及服务类别所组成的族群的一种配置资料。7.一种可配置分散型语音辨认伺服器,包含:一解析器,用以接收并解析一信息封包,以取得该信息封包中所包含的一配置资料及一语音资料;一配置控制器,用以处理该配置资料,并根据该配置资料产生一辨认调整参数,该辨认调整参数用以于该可配置分散型语音辨认系统于进行语音辨认时,根据该客户端装置的计算、记忆、通讯能力及频宽配置该可配置分散型语音辨认伺服器的资源;及一可配置分散型语音辨认引擎,用以辨识由该解析器传来的该语音资料,并接受该配置控制器的配置。8.如申请专利范围第7项所述之可配置分散型语音辨认伺服器,更包含一历史日志,用以纪录该分散型语音辨认伺服器中所产生的历史资料。9.如申请专利范围第8项所述之可配置分散型语音辨认伺服器,更包含一诊断工具组,根据该历史资料产生一诊断参数用以调校该可配置分散型语音辨认引擎。10.如申请专利范围第7项所述之可配置分散型语音辨认伺服器,更包含一可配置对话系统,该可配置对话系统根据该可配置分散型语音辨认引擎的辨认结果,分析产生于一对话中可能出现的字汇组,并供该可配置分散型语音辨认引擎于下次辨认时使用,以增进辨识率及辨识速度。11.如申请专利范围第7项所述之可配置分散型语音辨认伺服器,其中上述之信息封包系由一语音行动装置所传送出。12.如申请专利范围第11项所述之可配置分散型语音辨认伺服器,其中上述之配置资料,系选自于由一说话者声音轮廓、声音环境、通道效应、该语音行动装置规格以及服务类别所组成的族群的一种配置资料。图式简单说明:第一图为一习知的Aurora DSR基本架构。第二图用以说明本发明之可配置分散型语音辨认系统的较佳实施系统架构。第三图用以说明一客户端的资料处理步骤。
地址 新竹县竹东镇中兴路四段一九五号