发明名称 | 基于标识符空间映射的大数据二级索引构建方法 | ||
摘要 | 本发明提出了一种基于标识符空间映射的大数据二级索引构建方法,包括:根据查询属性生成索引条目,利用Baton协议组织索引节点及索引条目,建立Baton索引组织;数据处理节点在查询非Rowkey属性时,将查询所需数据请求发送给索引节点,索引节点通过Baton路由协议将数据检索请求发送到需检索索引条目所在的索引节点,所述索引节点通过物理地址获取所需数据,并发送给相应的数据处理节点。本发明有益效果:二级索引构建技术改进了HBase不支持索引构建与使用的缺点;利用云计算资源管理大量的属性索引,满足大量数据分析处理的二级索引需求;数据的检索与获得由索引节点完成,减轻了数据处理节点的负担,提高数据处理的效率。 | ||
申请公布号 | CN104252528B | 申请公布日期 | 2017.04.26 |
申请号 | CN201410449359.7 | 申请日期 | 2014.09.04 |
申请人 | 国家电网公司;国网山东省电力公司电力科学研究院 | 发明人 | 马艳;郭志红;陈玉峰 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 济南圣达知识产权代理有限公司 37221 | 代理人 | 张勇 |
主权项 | 一种基于标识符空间映射的大数据二级索引构建方法,其特征是,包括以下步骤:(1)根据查询属性生成索引条目,利用Baton协议组织索引节点及索引条目,建立Baton索引组织;(2)查询操作:数据处理节点在查询非Rowkey属性时,将查询所需数据请求发送给索引节点,索引节点通过Baton路由协议将数据检索请求发送到需检索索引条目所在的索引节点,所述索引节点通过物理地址获取所需数据,并发送给相应的数据处理节点;所述步骤(1)中建立索引组织的方法包括:a)对所有的属性索引统一编号;每一个属性索引都由若干索引条目组成,设e<sub>j</sub>为索引条目,I<sub>i</sub>为属性索引,则I<sub>i</sub>=∪{e<sub>j</sub>};其中,i为属性索引的编号,j为索引条目编号;b)每个索引条目e<sub>j</sub>都通过映射函数映射到标识符空间D的某个位置;所述标识符空间D为映射函数的值域范围;c)利用Baton组织索引节点,每个索引节点负责管理部分标识符空间,所有索引节点组成一个关于标识符空间D的覆盖网络,各索引节点基于Baton组成一个树型结构;d)确定各索引节点负责管理的索引条目,每个索引节点利用B+树存储自己所负责的索引条目;e)每个索引条目指向数据存储物理地址。 | ||
地址 | 250002 山东省济南市市中区望岳路2000号 |