发明名称 |
一种分布式列存储系统索引的方法 |
摘要 |
本发明公开了一种分布式列存储系统索引的方法,包括:获取每列数据的分布特征,设定每列数据的域值及划分规则;根据域值及划分规则,得到划分后的连续数据区域;分别对应每个数据区域建立一个区域编码向量;进行统计计算,得到每列数据的统计信息,将统计信息与对应的区域编码向量合并,得到带有统计信息的区域编码向量;将带有统计信息的区域编码向量作为位图索引的位向量进行数据的索引。所述分布式列存储系统索引的方法通过设定每列数据的域值和划分规则,使得分组位图索引的划分方式与查询的过滤条件相符合,通过计算列数据的统计信息,不仅提高了分组位图查询的准确性,而且能够保留列存储系统中数据的统计信息,保证数据信息的完整性。 |
申请公布号 |
CN106250523A |
申请公布日期 |
2016.12.21 |
申请号 |
CN201610634581.3 |
申请日期 |
2016.08.04 |
申请人 |
北京国电通网络技术有限公司;国家电网公司;国网北京市电力公司;北京中电飞华通信股份有限公司 |
发明人 |
孙乔;付兰梅;邓卜侨;孙雷;马慧远;刘炜;崔伟 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京风雅颂专利代理有限公司 11403 |
代理人 |
李弘;杨红梅 |
主权项 |
一种分布式列存储系统索引的方法,其特征在于,包括:获取列存储系统中每列数据的分布特征,根据获取的分布特征设定每列数据的域值以及每列数据的划分规则;根据所述每列数据的域值以及每列数据的划分规则,计算得到对数据划分后连续的数据区域;根据划分后的每个数据区域,分别对应建立一个区域编码向量;对每列数据进行统计计算,得到每列数据的统计信息,并将所述统计信息与对应的区域编码向量合并,得到带有统计信息的区域编码向量;将所述带有统计信息的区域编码向量作为位图索引的位向量,进行数据的索引操作。 |
地址 |
100070 北京市丰台区航丰路一号时代财富天地大厦28层 |