发明名称 具有分层存储的索引的搜索引擎
摘要 一种搜索引擎,其包括搜索WWW并且将在WWW上找到的网页存储在数据库(100)中的采集器(102)。索引器(105)将数据库中的网页编入索引以产生主索引。文档映射部件(114)基于网页的等级将数据库中的网页映射到多个分层中。等级可以基于网页中具有较高价值的上下文。处理器基于上述映射从主索引中产生多个子索引。子索引被存储在搜索节点组(160)中。该组是在逻辑上被排列成多个行和列的搜索节点矩阵。同一列中的搜索节点包括相同的子索引。同一行中的搜索节点包括不同的子索引。从用户(112)那接收到的搜索查询被发送到调度器(110),调度器又将查询转发给第一层的搜索节点。公开了滑落算法,其指示调度器何时应当将搜索查询转发给搜索节点的其它层。
申请公布号 CN100585590C 申请公布日期 2010.01.27
申请号 CN200480033085.8 申请日期 2004.11.09
申请人 雅虎公司 发明人 克努特·玛格纳·里斯维克;耶格威·阿舍米;托尔·埃格;哈瓦德·派特森
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京东方亿思知识产权代理有限责任公司 代理人 王 怡
主权项 1.一种用于为数据库中的数据项建立索引的方法,所述方法包括:从数据库中获取与各自的等级相关联的数据项,其中所述等级至少部分基于所述数据项的相关分数;基于所述数据项各自的等级将所述数据项映射到至少第一层和第二层上:基于所述映射从所述数据项的主索引产生至少第一和第二子索引;将所述第一子索引存储在第一多个搜索节点中,所述第一多个搜索节点在逻辑上被排列在第一多个列中;以及将所述第二子索引存储在第二多个搜索节点中,所述第二多个搜索节点在逻辑上被排列在第二多个列中。
地址 美国加利福尼亚州