发明名称 |
跨Web图传播信号 |
摘要 |
用于跨web图传播信号的方法的方法、系统和计算机可读介质。信号描述文件或另外地提供关于web图中文件的有用信息。web图为通过链接、例如超链接而彼此相关的文件的集合。来自相关页的信息与目标页相关联,即使该信息可能未直接在目标页中找到,在这个意义上,信号被传播。然后该信息可以被搜索引擎用来确定特定页与搜索查询相关。 |
申请公布号 |
CN102693264A |
申请公布日期 |
2012.09.26 |
申请号 |
CN201210037892.3 |
申请日期 |
2012.02.20 |
申请人 |
微软公司 |
发明人 |
T.W.芬利;H.D.M.杜亚特;B.米哈;戚德虎;T.H.吉布斯;S.穆图克里什南 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
中国专利代理(香港)有限公司 72001 |
代理人 |
黄维;刘鹏 |
主权项 |
一种将来自相关文件的术语添加到目标文件的文件描述的方法,该方法包括:确定610在所述相关文件中发现的术语不匹配过滤标准,其中匹配所述过滤标准的术语未添加到目标文件的文件描述,其中所述目标文件的文件描述包括在与所述目标文件相关联的多个信号流内的术语;计算620所述术语的相似性得分,其中所述相似性得分基于所述目标文件与所述相关文件之间的余弦相似性;基于所述相关文件的静态排序来计算630所述术语的来源可信度得分,其中所述静态排序基于所述相关文件的独立流行性得分;基于在链接中使用的术语与所述术语之间的相似性来计算640所述术语的确证得分;基于所述术语当前是否与通过其他来源的文件描述相关联来计算650所述术语的独特性得分;基于所述相似性得分、来源可信度得分、所述确证得分和所述独特性得分来计算660所述术语的术语得分;以及因为所述术语得分高于阈值得分,所以将所述术语与所述文件描述相关联670。 |
地址 |
美国华盛顿州 |