发明名称 结构化信息快速检索方法及系统
摘要 本发明提供一种结构化信息快速检索方法,先对结构化信息的数据源进行预处理,采用多线程的方式来不断地产生不同的索引片,生成小索引文件,然后定量或定期地把小索引文件合并到一个大索引文件中;数据分析:对所述大索引文件的域转换为最基本的索引表示单元项,这些索引表示单元项是用于决定匹配查询条件的信息;建立索引并入库;用户输入查询条件;解析:对用户输入的查询条件进行解析,即对用户输入的查询条件对应的每个查询项解析成索引表示单元项;利用索引表示单元项进行索引;将索引的结果集返回给用户。本发明通过建立颗粒度较小的索引文件,再合并为大索引文件;通过分级建立索引之后进行存储,能极大提高检索的效率。
申请公布号 CN102831174A 申请公布日期 2012.12.19
申请号 CN201210265923.0 申请日期 2012.07.27
申请人 福建富士通信息软件有限公司 发明人 陈进炘;唐敏;陈冬冬;涂大志;黄震奇
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 福州市鼓楼区京华专利事务所(普通合伙) 35212 代理人 宋连梅
主权项 一种结构化信息快速检索方法,其特征在于:包括如下步骤:步骤10、预处理:先对结构化信息的数据源进行预处理,并生成索引文件;所述预处理是抽取相同类型的结构化信息的公共信息,并在生成索引文件是对不同主机传递过来的相同类型的结构化信息的差异化数据进行单独处理;所述索引文件的生成方式是采用多线程的方式来不断地产生不同的索引片,生成小索引文件,然后定量或定期地把小索引文件合并到一个大索引文件中;步骤20、数据分析:对所述大索引文件的域转换为最基本的索引表示单元项,这些索引表示单元项是用于决定匹配查询条件的信息;步骤30、建立索引并入库:所述大索引文件的数据经分析后分级建立索引,再按顺序进行存储;步骤40、查询:用户输入查询条件;步骤50、解析:对用户输入的查询条件进行解析,即对用户输入的查询条件对应的每个查询项解析成索引表示单元项;步骤60、索引:利用步骤50所得的索引表示单元项进行索引;步骤70、返回结果:将索引的结果集返回给用户。
地址 350000 福建省福州市晋安区斗门水头路22号