发明名称 自动更新语言模型
摘要 本发明揭示了一种于一更正期间在一语音应用程式中更新一语言模型之方法,该方法包含下列步骤:自动在声音上将原始听写的文字之另一语音与替代文字之语音比较;以及如果在声音上的该比较结果接近到足以指示该新的语音代表一辨识错误而非一编辑的更正,则以一更正资讯自动更新该语言模型,因而无须使用者的互动即可更新该语言模型。该更新步骤可包含将新的字词加入该语音应用程式中的一语汇之步骤。
申请公布号 TW440809 申请公布日期 2001.06.16
申请号 TW088114074 申请日期 1999.08.18
申请人 万国商业机器公司 发明人 詹姆士R.勒威斯;玛丽亚史密斯
分类号 G10L3/00;G10L5/00 主分类号 G10L3/00
代理机构 代理人 陈长文 台北巿敦化北路二○一号七楼
主权项 1.一种于一更正期间在一语言应用程式中更新一 语言模型之方法,包含下列步骤: 自动在声音上将原始听写的文字之另一语音与替 代文字之语音比较;以及 如果在声音上的该比较结果接近到足以指示该新 的语音代表一辨识错误而非一编辑的更正,则以一 更正资讯自动更新语言模型,因而无须使用者的互 动即可更新该语言模型。2.如申请专利范围第1项 之方法,该方法在该比较步骤之前进一步包含下列 步骤: 侦测以新的文字取代该原始听写的文字;以及 储存该原始听写的语音及该新的语音,以便用于该 比较步骤。3.如申请专利范围第1项之方法,其中该 更新步骤包含下列步骤: 将新的字词加入该语音应用程式中的一语汇。4. 如申请专利范围第1项之方法,其中该比较步骤包 含下列步骤: 决定该新的文字中是否有任何字词超出语汇的范 围;以及 如果并无任何该字词超出语汇的范围,则将该语汇 中的现有基本形式用于该比较步骤。5.如申请专 利范围第1项之方法,其中该比较步骤包含下列步 骤: 决定该新的文字中是否有任何字词超出语汇的范 围; 如果有该任何字词超出语汇的范围,则决定于该任 何字词的一基本形式是否储存在该语汇的外部;以 及 如果该任何字词的该基本形式系储存在该语汇的 外部,则将该超出语汇范围的基本形式用于该比较 步骤。6.如申请专利范围第5项之方法,其中该更新 步骤包含下列步骤: 将该任何字词加入该语汇。7.如申请专利范围第1 项之方法,其中该比较步骤包含下列步骤: 决定该新的文字中是否有任何字词超出语汇的范 围; 如果该任何字词超出语汇的范围,则决定该任何字 词的一基本形式是否系储存在该语汇的外部;以及 如果并无该任何字词的该基本形式系储存在该语 汇的外部,则延迟产生用于该任何字词的一新基本 形式。8.如申请专利范围第1项之方法,其中该比较 步骤包含下列步骤: 决定该新的文字中是否有任何字词超出语汇的范 围; 如果该任何字词超出语汇的范围,则决定该任何字 词的一基本形式是否系储存在该语汇的外部; 如果并无该任何字词的该基本形式系储存在该语 汇的外部,则产生一个用于该任何字词之新基本形 式;以及 将该新的基本形式用于该比较步骤。9.如申请专 利范围第8项之方法,其中该更新步骤包含下列步 骤: 将该任何字词加入该语汇。10.如申请专利范围第1 项之方法,其中该比较步骤包含下列步骤: 决定该新的文字中是否有任何字词超出语汇的范 围; 如果该任何字词超出语汇的范围,则决定该任何字 词的一基本形式是否系储存在该语汇的外部; 如果该任何字词的该基本形式系储存在该语汇的 外部,则将该超出语汇范围的基本形式用于该比较 步骤;以及 如果并无该任何字词的该基本形式系储存在该语 汇的外部,则延迟产生用于该任何字词的一新基本 形式。11.如申请专利范围第1项之方法,其中该比 较步骤包含下列步骤: 决定该新的文字中是否有任何字词超出语汇的范 围; 如果该任何字词超出语汇的范围,则决定该任何字 词的一基本形式是否系储存在该语汇的外部; 如果该任何字词的该基本形式系储存在该语汇的 外部,则将该超出语汇范围的基本形式用于该比较 步骤; 如果并无该任何字词的该基本形式系储存在该语 汇的外部,则产生一个用于该任何字词之新基本形 式;以及 将该新的基本形式用于该比较步骤。12.如申请专 利范围第11项之方法,其中该更新步骤包含下列步 骤: 将该任何字词加入该语汇。13.如申请专利范围第1 项之方法,其中该比较步骤可包含下列步骤: 将原始听写的字词之各别基本形式与该等原始听 写的字词之替代比较。14.如申请专利范围第13项 之方法,包含下列步骤: 将各别的基本形式与一DMCHECK公用程式比较。图式 简单说明: 第一图是当替代文字具有语音时根据本发明配置 的一个面向的程式控制流动之流程图。 第二图是当以听写或打字之方式取得替代文字时 根据本发明配置的另一面向的程式控制流动之流 程图。
地址 美国