发明名称 编码语音资讯之上下文相关音素网路
摘要 一种可产生上下文相关音素网路以做为编码语音资讯之中间步骤之方法和装置。上下文相关音素网路系从在关连于操作系统(44)之音素网路产生器(48)中之语音所产生。然后上下文相关音素网路系被传输至第一应用(52)。
申请公布号 TW462037 申请公布日期 2001.11.01
申请号 TW087119918 申请日期 1998.12.01
申请人 摩托罗拉公司 发明人 斯利蓝扎拉克;史堤芬澳斯汀
分类号 G10L5/06 主分类号 G10L5/06
代理机构 代理人 陈长文 台北巿敦化北路二○一号七楼
主权项 1.一种编码语音资讯之方法,包含:使用适于使用者之声音之声音模型从音素网路产生器中之语音在本地使用者位置产生上下文相关音素网路,以作为语音辨认之中间步骤,其中上下文相关音素网路系代表以节点及弧表示之语音输入,每一弧代表一具有以节点表示之开始及结束时间之音素点数,音素网路致使语音输入以弧及节点表示,俾使语音输入被封装成一与字汇,语言模型,使用者及环境无关之中间格式;及将上下文相关音素网路传输至一或多个远离于本地使用者之应用程式,以致使远端应用程式使用一由应用程式选择之字汇或语言模型在每一应用程式执行语音辨认,俾使本地使用者位置不须执行语音辨认。2.如申请专利范围第1项之方法,其中上下文相关音素网路系与字汇和语言模型为无关。3.如申请专利范围第1项之方法,更包含:在一第一应用上予以撷取需要来自使用第一应用之字汇和语言模型之上下文相关音素网路之资讯以便于操作第一应用。4.一种编码语音资讯之方法,包含:提供包含两部分之操作系统,其中操作系统之第一部分系与可连续适应于使用者之声音之使用者和环境之特定声音模型为相关;及操作系统之第二部分系相关于从操作系统之第一部分无关地选择之第一应用,其中操作系统之第二部分系撷取从使用第一应用之字汇和语言模型所需要之资讯。5.如申请专利范围第4项之方法,其中操作系统之第一部分系产生上下文相关音素网路,以便于捕捉使用者和环境之特定声音模型并传输上下文相关音素网路至操作系统之第二部分。6.如申请专利范围第4项之方法,更包含第二应用,其中第一应用和第二应用系包含不同之字汇和不同之语言模型。7.如申请专利范围第4项之方法,更进而包含第二应用,其中第一应用和第二应用分享共同之字汇和共同之语言模型。8.一种编码语音资讯之方法,包含:藉由使用者和环境之特定声音模型和音素语言模型之辅助而转换语音至上下文相关音素网路;基于使用者和环境之特定声音模型和音素语言模型而连续地接收上下文相关音素网路;由语音讯号予以撷取做为语音辨认之所需要之资讯;及封装在字汇、语言模型、及使用者和环境之独立格式。9.一种编码语音资讯之装置,系包含:操作系统;产生具有定义上下文相关音素网路音素网路之输出之上下文相关音素网路音素网路之音素网路产生器;及适于接收音素网路产生器之输出之第一应用并从使用第一应用之字汇和语言模型之输出予以撷取所需之资讯,其中音素网路产生器和第一应用系与操作系统无关。10.一种电脑可读取之资料记录媒体,包含指令和资料,被载入具有操作系统之第一通用目的微处理器,该微处理器具有一作业系统以使第一通用目的微处理器包含:在本地使用者位置产生具有定义上下文相关音素网路之输出之上下文相关音素网路之音素网路产生器,其中上下文相关音素网路致使语音输入以节点及弧之形式表示其中每一弧代表一具有以节点表示开始及结束时间之音素点数,俾使语音输入被封装成一中间格式;及适于接收音素网路产生器之输出之复数个远离于本地使用者位置之应用程式,并从使用复数个应用程式之字汇和语言模型之输出以撷取所需之资讯,俾使不须自本地使用者位置撷取资讯,音素网路产生器和复数个应用程式系与操作系统无关。11.如申请专利范围第10项之资料记录媒体,其中资料记录媒体系包含具有储存在其上之音素网路产生器之第一部分及具有存在其上之复数个应用之第二部分。12.一种方法,包含:产生上下文相关音素网路以做为编码语音资讯之中间步骤;在第一搜寻引擎中尝试辨认;在第一搜寻引擎中辨认不满意之下,使上下文相关音素网路前进至第二搜寻引擎;及从第二搜寻引擎撷取候选者之辨认结果。图式简单说明:第一图系叙述简单之音素网路;第二图系根据本发明之理想实施例来叙述等于第一图之三音网路;第三图系根据本发明之理想实施例来叙述做为第二图之三音网路之编码;第四图系根据本发明之理想实施例之整个系统之通常方块图;第五图系根据本发明之理想实施例之整个系统之详细方块图;及第六图系根据本发明之理想实施例之第五图之详细方块图。
地址 美国