发明名称 一种在全文检索系统中快速更新数据域的方法
摘要 本发明公开了一种全文检索系统支持数据域快速更新的方法。本发明在倒排索引的技术基础上,对需要进行快速更新的数据域采用非倒排索引方式。通过将动态索引结构与倒排索引结构相结合,在全文检索系统中实现对数据域的快速更新,并通过线性索引,辅助从文档标识快速找到数据域的原内容并进行删除。该发明方法在略微降低建索引和检索的效率情况下,对部分数据域的更新具有很好的效率,达到了使全文检索系统可支持数据域快速更新的目的。随着信息技术的广泛应用,信息量爆炸性增长,信息检索的应用越来越深入,本发明的方法具有广泛的应用前景。
申请公布号 CN100498782C 申请公布日期 2009.06.10
申请号 CN200610112797.X 申请日期 2006.09.01
申请人 北大方正集团有限公司;北京大学;北京北大方正技术研究院有限公司 发明人 杨建武;程羽心;吴於茜;陈晓鸥
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京同达信恒知识产权代理有限公司 代理人 李 欣
主权项 1、一种在全文检索系统中快速更新数据域的方法,在建索引时,首先判断待建索引的内容所在的数据域是否需要支持快速更新,如需要支持,则采用非倒排结构对该需要支持快速更新的数据域中的内容进行索引,否则,采用倒排结构对该不需要支持快速更新的数据域中的内容进行索引;在更新时,采用非倒排索引更新该需要支持快速更新的数据域中的内容。
地址 100871北京市海淀区成府路298号方正大厦5层