发明名称 一种检索方法及检索装置
摘要 本发明公开了一种检索方法及检索装置,该方法包括:根据预设的数据项中的数据项值对索引库中的文档进行分组,获取到用户提交的检索条件时,执行下列步骤:根据检索条件中数据项的检索属性信息,确定出用于检索的第一检索条件和用于过滤的第二检索条件;通过第一检索条件对索引库进行检索,得到初步检索结果;以及查找第二检索条件中包含的数据项上的检索词所对应的数据项值,生成基于分组的过滤器;所述基于分组的过滤器仅允许或仅不允许设定分组的文档通过;依次通过各所述过滤器对初步检索结果中的命中文档进行过滤,得到最终检索结果。上述方法将部分检索条件转化为过滤条件,以减少检索和合并的过程,节约了系统资源,提高了处理速度。
申请公布号 CN102054007B 申请公布日期 2012.10.31
申请号 CN200910237186.1 申请日期 2009.11.10
申请人 北大方正集团有限公司;北京方正阿帕比技术有限公司;北京大学 发明人 童征宇;李晓蕊;刘志云;赵东岩;徐剑波
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京同达信恒知识产权代理有限公司 11291 代理人 郭润湘
主权项 一种检索方法,其特征在于,包括:建立预设的数据项中的每个数据项值与分组标识的对应关系、以及建立所述分组标识与索引库中包含该数据项值的各文档的文档标识之间的对应关系,获取到用户提交的检索条件时,执行下列步骤:根据所述检索条件中数据项的检索属性信息,确定出用于检索的第一检索条件和用于过滤的第二检索条件;通过所述第一检索条件对所述索引库进行检索,得到初步检索结果;以及查找所述第二检索条件中包含的数据项上的检索词所对应的数据项值,生成与所述第二检索条件对应的过滤信息;所述过滤信息中包括:过滤的数据项、对应的过滤方式、以及过滤的数据项上过滤值的形式和取值范围;根据所述过滤信息中过滤的数据项对应的过滤方式以及所述过滤值的形式和取值范围,确定对应的有效分组标识,生成仅允许或仅不允许所述有效分组标识所对应的文档通过的所述过滤器;或根据所述过滤信息直接查找到对应的预先缓存的基于分组过滤器;其中,所述基于分组的过滤器仅允许或仅不允许设定分组的文档通过;根据所述初步检索结果中命中文档的文档标识,确定命中文档所对应的分组标识;依次通过各所述过滤器对所述确定出的分组标识进行过滤,根据所述过滤器仅允许或仅不允许所述有效分组标识,得到能够通过各所述过滤器的文档,即为所述最终检索结果。
地址 100871 北京市海淀区成府路298号方正大厦9层