发明名称 |
分布式内存列式数据库的索引建立方法 |
摘要 |
本发明公开了一种分布式内存列式数据库的索引建立方法,包括:将单列数据切分为至少两个数据分片;并行计算每个数据分片的列式压缩索引的中间数据和行表向量的中间数据,所述列式压缩索引包括字典向量、索引向量以及位置向量;按序存储并更新每个数据分片的列式压缩索引的中间数据和行表向量的中间数据,以形成列式压缩索引和行表向量。本发明提供的分布式内存列式数据库的索引建立方法,对于巨表的导入计算节点并不需要多大的内存,可以节约硬件成本。 |
申请公布号 |
CN105843933A |
申请公布日期 |
2016.08.10 |
申请号 |
CN201610193216.3 |
申请日期 |
2016.03.30 |
申请人 |
电子科技大学 |
发明人 |
段翰聪;闵革勇;钟红霞;王瑾;李林;郑松;张博 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
成都行之专利代理事务所(普通合伙) 51220 |
代理人 |
郭受刚 |
主权项 |
一种分布式内存列式数据库的索引建立方法,其特征在于,包括:将单列数据切分为至少两个数据分片;并行计算每个数据分片的列式压缩索引的中间数据和行表向量的中间数据,所述列式压缩索引包括字典向量、索引向量以及位置向量;按序存储并更新每个数据分片的列式压缩索引的中间数据和行表向量的中间数据,以形成列式压缩索引和行表向量。 |
地址 |
610000 四川省成都市高新区(西区)西源大道2006号 |