发明名称 使用因特网语料库的自动上下文相关语言产生、校正和增强
摘要 一种计算机辅助语言产生系统,包括:语句检索功能,其基于包含词的输入文本来操作,以从因特网语料库检索多个语句,所述多个语句包含与在所述输入文本中的所述词对应的词;以及语句产生功能,其使用由所述语句检索功能从所述因特网语料库检索的多个语句来操作,以产生表达出所述输入文本的至少一个正确的语句。
申请公布号 CN102165435B 申请公布日期 2014.12.24
申请号 CN200980138185.X 申请日期 2009.02.04
申请人 金格软件有限公司 发明人 Y·卡罗夫赞格威尔
分类号 G06F17/20(2006.01)I 主分类号 G06F17/20(2006.01)I
代理机构 永新专利商标代理有限公司 72002 代理人 刘瑜;王英
主权项 一种计算机辅助语言产生方法,包括:语句检索步骤,其基于包含词的输入文本来操作,以从因特网语料库检索多个语句,所述多个语句包含与在所述输入文本中的所述词对应的词;语句产生步骤,其使用由所述语句检索步骤从所述因特网语料库检索的多个语句来操作,以产生表达出所述输入文本的至少一个正确的语句,其中,所述语句产生步骤包括:语句简化步骤,用于简化从所述因特网语料库检索的所述语句;简化语句分组步骤,用于对由所述语句简化步骤提供的类似的简化语句进行分组;以及简化语句组分级步骤,用于对所述类似的简化语句的组进行分级;替换产生步骤,用于基于输入语句来产生基于文本的表示,所述基于文本的表示提供在所述语句中的多个词的每一个的多个替换;选择步骤,用于至少部分地基于因特网语料库来至少在所述语句的所述多个词的每一个的所述多个替换中进行选择;以及校正产生步骤,用于基于由所述选择步骤作出的选择来提供校正输出;其中,所述选择步骤包括基于上下文的评分步骤,所述基于上下文的评分步骤用于至少部分地基于上下文特征序列CFS在因特网语料库中的出现频率来对所述多个替换进行分级。
地址 美国马塞诸塞州