发明名称 语音辨识之多形式清晰化之方法、媒体和装置
摘要 本发明提供一种结合了一或多种替代的输入形式(modality)之语音辨识系统用以确保有效率及正确的文字输入。语音辨识系统因为有限的处理能力,环境噪音,及/或说话风格上的自然变化等因素的关系而尚未达到完全正确的程度。可供选择之输入形式使用清晰化或识别引擎来补偿减缩的键盘,潦草的输入,及/或在书写风格上之自然的变化。在语音辨识处理中之歧意性(ambiguity)大多数系与可供选择之输入模式中固有的歧意性正交,使得两种形式的结合可有效率地及正确地解决辨识错误。本发明特别适用于可携式装置其供键盘输入或触控萤幕输入的空间很有限。
申请公布号 TWI266280 申请公布日期 2006.11.11
申请号 TW094118264 申请日期 2005.06.02
申请人 线上股份有限公司 发明人 朗吉麦可;伊罗德理查;胡费许基斯C HULLFISH, KEITH C.
分类号 G10L15/00(2006.01) 主分类号 G10L15/00(2006.01)
代理机构 代理人 蔡坤财 台北市中山区松江路148号11楼
主权项 1.一种用来处理在一资料处理系统中之语言输入的方法,其至少包含以下的步骤:接收一包含声音输入的第一输入;根据该第一输入决定一或多个候选字;接收一包含非声音输入之第二输入;及根据该第一输入及第二输入来决定一或多个候选字。2.如申请专利范围第1项所述之方法,其中该一或多个候选字系根据该第二输入在第一输入的限制下所决定的。3.如申请专利范围第2项所述之方法,其中该一或多个候选字系根据第一输入在考量字的脉络(context)下决定的。4.如申请专利范围第3项所述之方法,其中该字的脉络系根据以下所列的任何一者:一N-gram语言模式;及一语音辨识引擎的语言模式。5.如申请专利范围第1项所述之方法,其中决定该一或多个候选字的步骤包含了根据该第二输入来修正或过滤该第一复数个候选字的步骤。6.如申请专利范围第1项所述之方法,其中该第二输入是在一行动装置上被接收;及其中对于声音输入的语音辨识部分是在该行动装置上实施的且部分是在一透过无线通信连接耦合至该行动装置的伺服器上实施的。7.如申请专利范围第6项所述之方法,其中该语音辨识是藉由该行动装置上的一压下通话(push-to-talk)钮来启动的。8.如申请专利范围第1项所述之方法,其中该第二输入是在一或多个候选字被呈现以进行选取或编辑时被接收的。9.如申请专利范围第8项所述之方法,其中该第二输入包含以下所列的任何一者:一触控键盘;手写姿势辨识;及小键盘输入。10.如申请专利范围第1项所述之方法,其中当该第二输入与标点符号或符号相关连时,该第一输入被诠释为标点符号或一或多个其它符号。11.一种其上储存有指令之机器可读取的媒体,该等指令在一资料处理系统上被执行时会让该资料处理系统实施一用于处理语言输入的方法,该方法至少包含以下的步骤:接收一包含声音输入的第一输入;根据该第一输入决定一或多个候选字;接收一包含非声音输入之第二输入;及根据该第一输入及第二输入来决定一或多个候选字。12.如申请专利范围第11项述之机器可读取的媒体,其中该一或多个候选字系根据第一输入在考量字的脉络(context)下决定的;及该字的脉络系根据以下所列的任何一者:一N-gram语言模式;及一语音辨识引擎的语言模式。13.如申请专利范围第11项述之机器可读取的媒体,其中决定该一或多个候选字的步骤包含了修正该第一复数个候选字的步骤。14.如申请专利范围第11项述之机器可读取的媒体,其中该第二输入是在一行动装置上被接收;及其中对于声音输入的语音辨识部分是在该行动装置上实施的且部分是在一透过资料连接而耦合至该行动装置的伺服器上实施的;及其中该语音辨识是藉由该行动装置上的一压下通话(push-to-talk)钮来启动的。15.如申请专利范围第11项述之机器可读取的媒体,其中该第二输入是在一或多个候选字被呈现以进行编辑时,或是在该第一复数个候选字被呈现以进行选取时被接收的;及该第二输入包含以下所列的任何一者:一触控键盘;手写姿势辨识;及小键盘输入。16.一种用于处理语言输入之行动装置,其至少包含:一语音辨识形式,用来处理一包含语音输入之第一输入;及一或多个第二输入形式,用来处理包含非语音输入之第二输入;一处理形式,其耦合至该一或多个第二输入形式及该语音辨识形式,该处理形式根据该第一输入决定一第一复数候选字并接下来根据该第一输入及第二输入来决定一或多个候选字。17.如申请专利范围第16项所述之装置,其中该一或多个候选字系根据该第二输入在第一输入的限制下及在考量字的脉络(context)下决定的;及该字的脉络系根据以下所列的任何一者:一N-gram语言模式;及一语音辨识引擎的语言模式。18.如申请专利范围第16项所述之装置,其中该一或多个候选字系藉由修正该第一复数个候选字来决定的。19.如申请专利范围第16项所述之装置,其中对于声音输入的语音辨识部分是在该行动装置上实施的且部分是在一透过无线通信连接耦合至该行动装置的伺服器上实施的;及其中该语音辨识是藉由该行动装置上的一压下通话(push-to-talk)钮来启动的。20.如申请专利范围第16项所述之装置,其中该第二输入是在一或多个候选字被呈现以进行编辑时,或是在该第一复数个候选字被呈现以进行选取时被接收的;及该第二输入包含以下所列的任何一者:一触控键盘;手写姿势辨识;及小键盘输入。图式简单说明:第1图为一示意图,其显示依据本发明的一用来辨识在一资料处理系统上之使用者输入的系统;第2图为依据本发明之用来辨识使用者输入的资料处理系统的方块图;第3图为用来处理在一依据本发明的资料处理系统中之语言输入的方法的流程图;第4图为一方块图,其提供一例子,其中一使用者已依据本发明的实施例口述一个字;及第5A-5C图为方块图,其提供一个例子,其中一使用者已依据本发明的实施例口述一个字。
地址 美国