发明名称 基于历史数据的信息检索
摘要 系统(125)识别文档并获得与所述文档有关的一种或多种历史数据。系统(125)可以至少部分基于一种或多种历史数据,来生成用于所述文档的分值。
申请公布号 CN1879107B 申请公布日期 2014.10.15
申请号 CN200480033254.8 申请日期 2004.09.15
申请人 GOOGLE公司 发明人 阿努拉格·阿查雅;马特·卡特斯;杰弗里·迪安;保罗·哈阿;莫尼卡·亨辛格;厄斯·霍尔泽勒;史蒂夫·劳伦斯;卡尔·菲勒格;奥尔坎·瑟斯诺格鲁;西蒙·佟
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 中国国际贸易促进委员会专利商标事务所 11038 代理人 康建忠
主权项 一种计分文档的方法,包括:识别文档;获得与所述文档有关的多种历史数据,所述多种历史数据至少包括:关于与所述文档关联的初始日期的数据,其中所述初始日期至少基于以下之一:搜索引擎首次获悉或索引所述文档的日期,搜索引擎首次发现到所述文档的链接的日期,或者在另一个文档中首次参考所述文档的日期,并且其中通过域注册所述文档的日期和所述文档至少包括阈值数目页的日期中的至少一个可以用作所述初始日期;关于文档内容随时间改变的数据,其中所述关于文档内容随时间改变的数据基于:更新频率,其基于在一段时间周期内所述文档的内容多久发生改变,和更新量,其基于在一段时间周期内所述文档的内容改变多少;以及至少另一种数据,其中所述至少另一种数据至少包括以下之一:关于一个或多个在先搜索查询的查询分析数据,其中针对所述一个或多个在先搜索查询,所述文档被标识为搜索结果;关于到或来自所述文档的链接的行为的基于链接的标准;关于与到所述文档的链接关联的锚文本的数据;关于与所述文档关联的广告通信量的时间变化特性的数据;关于所述文档的用户行为数据;关于与所述文档关联的域的合法性的域相关数据;关于所述文档的等级历史的数据;与所述文档关联的用户维护或生成的数据,其中,用户维护或生成的数据与下列中的至少一个有关:与一个用户或多个用户有关的喜好列表、书签、临时文件和缓冲文件;关于与到所述文档的链接相关联的锚文本中的唯一字、二元语法或短语的数据;关于独立对等体的连接的数据,或关于与所述文档关联的随时间变化的文档标题的数据;以及至少部分基于关于所述初始日期的数据、关于文档内容随时间改变的数据和与所述文档关联的所述至少另一种数据生成用于所述文档的分值,其中,生成分值包括:确定所述用户维护或生成的数据是否表示用户对所述文档感兴趣;以及至少部分基于用户维护或生成的数据是否表示用户对所述文档感兴趣,来计分所述文档。
地址 美国加利福尼亚