发明名称 |
使用传播的文档相关性来训练排名功能 |
摘要 |
提供了一种用于将已标记文档对于一查询的相关性传播至未标记文档的方法和系统。传播系统提供包括查询、以其对于这些查询的相关性标记的文档和未标记文档的训练数据。传播系统随后计算训练数据中文档对之间的相似性。传播系统随后将已标记文档的相关性传播至类似但未标记的文档。传播系统可以迭代地传播文档的标记,直到其收敛于一解。具有所传播的相关性的训练数据随后可以被用于训练排名功能。 |
申请公布号 |
CN101390096B |
申请公布日期 |
2011.06.08 |
申请号 |
CN200780006713.7 |
申请日期 |
2007.02.27 |
申请人 |
微软公司 |
发明人 |
王珏;李明敬;马韦莹;李智伟 |
分类号 |
G06F17/30(2006.01)I;G06F17/21(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
上海专利商标事务所有限公司 31100 |
代理人 |
陈斌 |
主权项 |
一种用于训练文档排名组件的系统,包括:包含训练数据的训练数据存储(232),所述训练数据包括文档的表示,以及对于多个查询中的每一查询,用所述文档中的某一些对于所述查询的相关性而对所述文档进行的标记;创建其中文档被表示为由表示文档之间的相似性的边所连接的节点的图的图组件;基于文档之间的相似性将已标记文档的相关性传播至未标记文档的传播相关性组件(235);以及训练文档排名组件以基于所述训练数据中的所传播的所述文档的相关性来对文档对于查询的相关性进行排名的训练组件(241)。 |
地址 |
美国华盛顿州 |