发明名称 扩展索引的方法
摘要 一种索引结构和扩展索引的方法,包含:(a)在内存中对新插入的数据源进行生成倒排索引的索引操作;(b)如果索引操作所包含的源数据的个数达到第一阀值k1,则将所生成的倒排索引顺序地写入第一子索引文件;(c)如果第一子索引文件中最小的索引组的个数达到第二阀值k2,则把这k2个索引组合并成更大的索引组,顺序地写入第二子索引文件;(d)如果第二子索引文件中最小的索引组达到第三阀值k3个,则把它们组合并成更大的索引组,顺序地写入第一子索引文件。由于索引更新大都发生在小索引组中,大索引组的IO操作次数减少,因此能提高索引建立/更新速度,另外,可以根据系统资源的使用情况自动调整阀值k1、k2、k3。
申请公布号 CN100458779C 申请公布日期 2009.02.04
申请号 CN200510124283.1 申请日期 2005.11.29
申请人 国际商业机器公司 发明人 陈伟柱;苏中;张俐;王睿
分类号 G06F17/30(2006.01) 主分类号 G06F17/30(2006.01)
代理机构 北京市中咨律师事务所 代理人 于静;李峥
主权项 1.一种扩展索引的方法,该索引包含一个第一子索引文件和一个第二子索引文件,该方法包含以下步骤:(a)在内存中对新插入的源数据进行生成倒排索引的索引操作;(b)如果索引操作所包含的源数据的个数达到一个预定的第一阀值k1,则将所生成的倒排索引,作为一个最小的索引组,顺序地写入第一子索引文件;(c)如果第一子索引文件中最小的索引组的个数达到一个预定的第二阀值k2,则把这k2个索引组合并成一个更大的索引组,顺序地写入第二子索引文件;否则返回步骤(a);(d)如果第二子索引文件中最小的索引组的个数达到第三阀值k3,则把这k3个索引组合并成一个更大的索引组,顺序地写入第一子索引文件,返回步骤(c);否则,返回步骤(a)。
地址 美国纽约