发明名称 |
用于记号空间资料库的多级查询处理系统与方法 |
摘要 |
一种用于在多级查询处理系统中处理查询的方法,所述方法包括:响应于一个或多个查询项从索引中检索第一文档标识符集合;针对相应于第一文档标识符集合的至少一个子集的第一压缩文档集合,生成相关性得分的第一集合;针对第一压缩文档集合中的文档,生成相关性得分的第二集合;读取相关性得分的第一集合和第二集合,生成文档的有序列表用于进一步处理;从所述文档的有序列表中的文档自动地生成附加查询项;使用所述附加查询项制定新查询;处理所述新查询,以从所述索引检索第二文档标识符集合,并且至少部分基于所述附加查询项生成相关性得分的第三集合;以及使用所述相关性得分的第三集合来选择用于呈现给用户的顶部文档的集合。 |
申请公布号 |
CN102142038A |
申请公布日期 |
2011.08.03 |
申请号 |
CN201110121210.2 |
申请日期 |
2005.08.08 |
申请人 |
谷歌股份有限公司 |
发明人 |
杰弗里.A.迪安;保罗.G.哈尔;奥尔坎.瑟齐诺格鲁;阿米塔布.K.辛加尔 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京市柳沈律师事务所 11105 |
代理人 |
邵亚丽 |
主权项 |
一种用于在多级查询处理系统中处理查询的方法,所述多级查询处理系统具有一个或多个处理器以及用于存储一个或多个程序的存储器,所述一个或多个程序由所述一个或多个处理器运行以执行所述方法,所述方法包括:由所述一个或多个处理器执行查询的第一级处理,包括:响应于一个或多个查询项,由所述一个或多个处理器从索引中检索第一文档标识符集合;针对相应于第一文档标识符集合的至少一个子集的第一压缩文档集合,基于查询项的存在、项频度和文档流行性中的一个或多个,由所述一个或多个处理器生成相关性得分的第一集合,并且将相关性得分的第一集合存储在存储器中;由所述一个或多个处理器执行查询的第二级处理,包括:针对第一压缩文档集合中的文档,基于记号位置的列表、文档中的查询项之间的距离、文档中的记号的属性以及出现在第一文档集合的文档中使用的查询项周围的文本中的一个或多个,由所述一个或多个处理器生成相关性得分的第二集合,并且将相关性得分的第二集合存储在存储器中;由所述一个或多个处理器从存储器读取相关性得分的第一集合和第二集合,并且基于相关性得分的第一集合和第二集合生成文档的有序列表用于进一步处理;由所述一个或多个处理器从所述文档的有序列表中的文档自动地生成附加查询项;由所述一个或多个处理器使用所述附加查询项,制定新查询;由所述一个或多个处理器处理所述新查询,以从所述索引检索第二文档标识符集合,并且至少部分基于所述附加查询项生成相关性得分的第三集合;以及由所述一个或多个处理器使用所述相关性得分的第三集合来选择用于呈现给用户的顶部文档的集合。 |
地址 |
美国加利福尼亚州 |