发明名称 一种支持全文检索系统同时检索数值类型数据域的方法
摘要 本发明公开了一种支持全文检索系统同时检索数值类型数据域的方法。该方法通过将数值类型的数据值转换成具有固定长度的有序的位串作为索引项实现数值类型数据的快速索引与检索,实现了全文检索系统对数值类型数据域的支持,解决了全文检索系统对结构化数据支持的问题。从而达到了使全文检索系统可同时对结构化数据和非结构化数据进行处理的目的。随着信息量爆炸性增长,信息检索的需要越来越深入,本发明的方法具有广泛的应用前景。
申请公布号 CN100498783C 申请公布日期 2009.06.10
申请号 CN200610112798.4 申请日期 2006.09.01
申请人 北大方正集团有限公司;北京大学;北京北大方正技术研究院有限公司 发明人 杨建武;李超;张阜东;吴於茜
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京同达信恒知识产权代理有限公司 代理人 李 欣
主权项 1、一种支持全文检索系统同时检索数值类型数据域的方法,在创建索引时,判断待建索引内容的数据域是否是数值类型,如是,提取其数据值,并转换成相应位串,将位串作为索引项加入索引表中;在检索时,进行以下操作:1)读取检索条件;2)将检索条件分解成数值类型检索部分和文本类型检索部分,并分别进行如下操作:A:对数值类型检索部分提取检索条件中数据域的数据值,并转换成相应位串,形成由此位串作为检索项所界定的数值范围的检索条件;B:对文本检索部分,采用传统的文本检索方法进行检索条件分析;3)将上述得到的检索条件组合,检索出相应文档集并输出。
地址 100871北京市海淀区成府路298号方正大厦5层