发明名称 |
一种对检索结果进行后续处理的方法及装置 |
摘要 |
为了解决现有技术全文检索系统整体效率不高的问题,本发明公开了一种对检索结果进行后续处理的方法及装置,该方法包括:检索后得到多个命中文档,以命中文档的一个群组数据项属性值作为后续处理的依据时,利用各命中文档的文档标识,以及文档标识和原始数据项标识的对应关系,确定各命中文档对应的原始数据项标识,其中一个原始数据项标识对应一组文档标识,多个原始数据项标识对应一个群组数据项标识,群组数据项标识与群组数据项属性值相对应;通过根据各命中文档对应的原始数据项标识对命中文档进行后续处理,实现以一个群组数据项属性值为依据的后续处理,正是由于将某些属性相同的文档归纳成一个文档集合,进而提高了检索系统整体效率。 |
申请公布号 |
CN102117276B |
申请公布日期 |
2013.04.03 |
申请号 |
CN200910217514.1 |
申请日期 |
2009.12.31 |
申请人 |
北大方正集团有限公司;北京方正阿帕比技术有限公司;北京大学 |
发明人 |
徐剑波;童征宇;赵东岩 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京同达信恒知识产权代理有限公司 11291 |
代理人 |
郭润湘 |
主权项 |
一种对全文检索结果进行后续处理的方法,其特征在于,包括:检索后得到多个命中文档;利用各命中文档的文档标识,以及文档标识和原始数据项标识的对应关系,确定各命中文档对应的原始数据项标识,其中所述原始数据项标识是用于标示根据命中文档的特征字符划分出的多个不相交的原始集合,其中一个所述原始数据项标识对应一组文档标识,多个所述原始数据项标识对应一个群组数据项标识,其中所述群组数据项标识是用于标示根据群组数据项属性值将所述原始集合组合成的多个群组集合,其中所述群组数据项属性值为一所述原始集合的特征字符的一部分,所述群组数据项标识与群组数据项属性值相对应;通过根据各命中文档对应的原始数据项标识对命中文档进行后续处理,实现以一个群组数据项属性值为依据的后续处理。 |
地址 |
100871 北京市海淀区成府路298号方正大厦9层 |