发明名称 语言内统计机器翻译
摘要 可提供训练数据,该训练数据包括源短语和目标短语对。这些对可用于训练语言内统计机器翻译模型,其中该语言内统计机器学模型在被给予人类语言的文本输入短语时可计算输入短语与人类语言的输入短语的可能翻译在语义上等价的概率。该统计机器翻译模型可用于在查询和列表之间进行翻译。查询可以是提交给搜索引擎的人类语言的文本串。列表串可以是将要由搜索引擎搜索以找出对查询串的匹配的真实世界实体的正式名称的文本串。
申请公布号 CN101981566A 申请公布日期 2011.02.23
申请号 CN200980112180.X 申请日期 2009.02.27
申请人 微软公司 发明人 X·李;Y·菊;G·茨威格;A·埃西罗
分类号 G06F17/28(2006.01)I;G06F17/27(2006.01)I;G06F17/20(2006.01)I 主分类号 G06F17/28(2006.01)I
代理机构 上海专利商标事务所有限公司 31100 代理人 杨洁;钱静芳
主权项 一种用于人类语言的短语的语言内机器翻译的计算机实现的方法,所述方法包括:接收训练数据,所述训练数据包括源短语和目标短语对(120、156、158);使用训练数据对来训练(100)语言内统计机器翻译模型(160、162),其中所述语言内统计机器翻译模型在被给予所述人类语言的文本输入短语时能够计算所述输入短语与所述人类语言的输入短语的可能翻译在语义上等价的概率(102);以及使用所述统计机器翻译模型来在查询和列表之间进行翻译(164),其中所述查询包括提交给搜索引擎(156)的所述人类语言的文本串,其中列表串包括将由所述搜索引擎搜索以找出对所述查询串的匹配(158)的真实世界实体的正式名称的文本串。
地址 美国华盛顿州