发明名称 非罗马字符的容错罗马化输入方法
摘要 本发明公开容错系统和方法以处理并校正诸如汉语、日语和韩语(CJK)等基于非罗马系语言的输入拼写错误。该方法可以用于使用拼音的汉语输入方法。例如,该方法通常包括接收代表汉字的拼音输入,该输入至少有一个初始拼音,识别输入中的潜在错误拼音。把每一个潜在错误拼音都扩展为至少一个附加可选拼音,每一对潜在错误和相应的可选拼音都具有近似性测量,把每一个输入的拼音和每一个可选拼音都转换成汉字,计算拼音输入可能转换成汉字的可能性,每一个可能的汉字转换都是该输入的被转换的初始和/或可选拼音的结合,概率基于近似性测量并可选地根据可能的汉语转换的上下文语境,从可能的转换中确定最有可能的汉语转换。
申请公布号 CN101133411A 申请公布日期 2008.02.27
申请号 CN200580036712.8 申请日期 2005.08.15
申请人 GOOGLE公司 发明人 吴军;陈利人
分类号 G06F17/27(2006.01);G06F3/023(2006.01) 主分类号 G06F17/27(2006.01)
代理机构 北京康信知识产权代理有限责任公司 代理人 余刚;尚志峰
主权项 1.一种容错输入处理方法,包括:接收用代表一种语言字符的格式所进行的输入,所述输入至少有一个初始组件;识别所述输入的多个潜在错误组件;将所述输入的每一个潜在错误组件都扩展为用所述格式的至少一个附加可选组件,每一对所述输入的潜在错误组件及其相应的附加可选组件都具有近似性测量;把所述输入的每一个组件和用所述格式的每一个附加可选组件都转换成所述语言;计算所述输入可能转换为所述语言字符的可能性,每一个可能转换都是所述输入的被转换的初始和/或可选组件的结合,所述可能性至少部分依据所述近似性测量;以及从所述输入的可能转换中确定最可能的语言字符转换。
地址 美国加利福尼亚州