发明名称 一种Hadoop上面向范围查询的内存缓存方法
摘要 本发明公开了一种Hadoop上面向范围查询的内存缓存方法,包括如下步骤:1)在Hadoop海量数据的查询属性上建立索引,将索引存放在HBase上;2)在HBase索引数据上建立内存分片缓存,选择频繁被访问的索引数据缓存在内存中,数据分片的划分在初始阶段采用固定长度等分方法,同时采用跳表(skiplist)组织众多的数据分片;3)根据数据查询记录命中数据,采用指数平滑方法衡量数据分片热度;4)更新内存缓存。本发明的优点是采用跳表和集合相结合的结构,在此结构上支持动态调整集合的分片边界,使数据分片自适应查询需求,提高热点数据分片的查询缓存命中率,降低查询访问磁盘的开销,从而大幅度提高范围查询的性能。
申请公布号 CN103942289A 申请公布日期 2014.07.23
申请号 CN201410144808.7 申请日期 2014.04.12
申请人 广西师范大学 发明人 李先贤;葛微
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 桂林市华杰专利商标事务所有限责任公司 45112 代理人 刘梅芳
主权项 一种Hadoop上面向范围查询的内存缓存方法,其特征是,包括如下步骤:1)在Hadoop海量数据的查询属性上建立索引,将索引存放在HBase上;2)在HBase索引数据上建立内存分片缓存,选择频繁被访问的索引数据缓存在内存中,数据分片的划分在初始阶段采用固定长度等分方法,同时采用跳表组织众多的数据分片;3)根据数据查询记录命中数据,采用指数平滑方法衡量数据分片热度;4) 更新内存缓存。
地址 541004 广西壮族自治区桂林市七星区育才路15号