发明名称 用于大文档索引的匹配漏斗
摘要 提供了一种用于大文档索引的匹配漏斗。通过以多个阶段评估和修剪候选文档来响应于搜索查询识别并返回搜索结果。该过程采用对文档中发现的义原和文档/义原对的预先计算的评分编索引的搜索索引。当接收到搜索查询时,从搜索查询识别义原且基于所识别的义原生成重新阐述的查询。重新阐述的查询用于识别匹配文档,且使用简化评分函数和搜索索引中预先计算的评分来生成匹配文档的初步评分。基于初步评分来修剪文档,且使用最终排序算法来评估其余文档,最终排序算法提供排序文档的最终集合,其用于响应于搜索查询生成搜索结果以返回。
申请公布号 CN102567461B 申请公布日期 2015.07.08
申请号 CN201110373395.6 申请日期 2011.11.22
申请人 微软技术许可有限责任公司 发明人 K.M.里斯维克;M.霍普克洛夫特;J.G.贝内特;K.卡尔亚纳拉曼;T.基林比;C.P.沃特斯;J.O.彼得森
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 中国专利代理(香港)有限公司 72001 代理人 黄维;刘鹏
主权项 一种使用分阶段过程响应于搜索查询提供搜索结果的方法:接收(602)搜索查询;重新阐述(604)所述搜索查询以识别用来查询搜索索引的一个或多个义原,所述搜索索引存储多个义原,所述多个义原包括一个或多个n元语法,一个或多个n‑元组和一个或多个近n‑元组;基于在重新阐述的搜索查询中识别的所述一个或多个义原来从搜索索引识别(606)文档的初始集合;使用简化的评分函数和预先计算的评分这两者来计算(702)文档的初始集合中每个文档的初步评分,该预先计算的评分存储于文档的初始集合和一个或多个义原的文档/义原对的搜索索引中,其中每个文档/义原对的预先计算的评分表示从文档中提取的义原在该文档的上下文中的重要性,并且其中简化的评分函数包含全排序算法的排序特征的子集;基于所述初步评分从所述文档的初始集合选择(704)文档的修剪集合;使用不同于简化的评分函数的所述全排序算法来计算(408)所述文档的修剪集合中每个文档的排序评分以提供排序文档的集合;以及基于所述排序文档的集合提供(410)搜索结果以便向终端用户呈现。
地址 美国华盛顿州