发明名称 |
点击距离确定 |
摘要 |
根据本地存储的倒排索引中包括的数据为文档语料库中的每一文档进行点击距离值的高效确定。点击距离是从网络上的第一文档到另一文档的点击或用户导航次数的度量。在本地存储的倒排索引中存储专门字词。专门字词使源文档与一组目标文档相关。当根据传入该专门字词之一的查询为相应的目标文档集查询倒排索引时向源文档赋一点击距离。为文档语料库中的每一文档重复该过程。 |
申请公布号 |
CN101273350A |
申请公布日期 |
2008.09.24 |
申请号 |
CN200680035828.4 |
申请日期 |
2006.09.25 |
申请人 |
微软公司 |
发明人 |
M·佩特里克 |
分类号 |
G06F17/00(2006.01);G06F17/30(2006.01) |
主分类号 |
G06F17/00(2006.01) |
代理机构 |
上海专利商标事务所有限公司 |
代理人 |
张政权 |
主权项 |
1.一种用于确定与网络上的文档相关联的点击距离的计算机实现方法,包括:存储文档(210)的文档和链接信息(218);在所述文档和链接信息(218)内,还存储与目标文档(574)相关联的专门字词(580),其中所述专门字词(580)指定对应于所述目标文档(574)的源文档(572);在倒排索引(510)中包括所述专门字词(580),其中所述本地存储的倒排索引(510)使所述专门字词与所述目标文档(574)的标识符相关;以及当根据传入所述专门字词(580)的查询对所述目标文档(574)查询倒排索引时,对所述源文档(572)赋予一点击距离。 |
地址 |
美国华盛顿州 |