从非结构化资源挖掘短语对,申请号CN201080023190.9-传众专利搜索

首页产品黄页商标征信

会员服务注册登录

法人/股东/高管

发明名称	从非结构化资源挖掘短语对
摘要	挖掘系统应用查询来从非结构化资源检索结果项。非结构化资源可以对应于可通过网络访问的资源项的储存库。被检索的结果项可以对应于与资源项相关联的文本段(例如，句子段)。挖掘系统通过过滤结果项和建立相应的结果项对，来产生结构化训练集。训练系统可以使用该训练集来产生统计翻译模型。翻译模型可以用于单语种上下文中，以在单一语言的语义相关的短语之间翻译。翻译模型也可以用于双语上下文中，以在以两种相应的语言表示的短语之间翻译。还描述了翻译模型的各种应用。
申请公布号	CN102439596A	申请公布日期	2012.05.02
申请号	CN201080023190.9	申请日期	2010.05.14
申请人	微软公司	发明人	W·B·多兰;C·J·布罗克特;J·J·卡斯蒂略;L·H·范德温德
分类号	G06F17/30(2006.01)I;G06F17/27(2006.01)I;G06F17/26(2006.01)I	主分类号	G06F17/30(2006.01)I
代理机构	上海专利商标事务所有限公司 31100	代理人	蔡悦
主权项	一种用于使用电气数据处理功能来创建用于训练统计翻译模型的训练集的方法(600)，包括：构建(606)查询；向电气数据检索模块呈现(608)所述查询，所述检索模块被配置成基于所述查询来在非结构化资源内执行搜索操作；从所述检索模块接收(610)结果集，所述结果集提供由所述检索模块所标识的结果项，作为所述搜索操作的结果；以及对所述结果集执行(612)处理，以产生结构化训练集，所述训练集标识所述结果集内的所述结果项对，所述训练集提供一个基础，通过该基础，电气训练系统能够学习所述统计翻译模型。
地址	美国华盛顿州

您可能感兴趣的专利

Verfahren zur Herstellung von Kuenstlich geformten Gebilden, wie Faeden, Blaetter, Baender, Filme und Roehren, aus Polymerisatoen von AEthylen

Fermeture pour réservoir sous pression intérieure

Procédé pour l'obtention de composés organiques oxygénés

Montre-bracelet

Assemblage d'axe et de manivelle, particulièrement applicable aux pédaliers de cycles

Générateur haute fréquence à structure compacte

Perfectionnements aux tampons vérificateurs d'alésages

Perfectionnements aux water-ballasts pour navires

Fremgangsmåde ved fremstilling af begmastiks.

Apparat til styring af kontaktorer ved hjælp af transduktorer.

Perfectionnements aux composés destinés en particulier à être utilisés comme flux de soudure

Plaque d'appui pour lingotières

Perfectionnements apportés aux mécanismes de transmission par friction

Enrouleur de cheveux à épinglage automatique

Pétrolier destiné au transport de combustibles liquides en vrac

Improvements in or relating to hat boxes

Improvements in or relating to magnetrons

Improvements in or relating to fishing reels