发明名称 |
一种分布式数据仓库的访问方法和装置 |
摘要 |
本发明提供了一种分布式数据仓库的访问方法和装置:将接收到的每个文本格式的文件转换为结构化格式,并进行存储;每个结构化格式的文件中包括一个文件头(Head)、一个以上数据段(Segment)以及一个一级块索引表,一级块索引表中保存有每个Segment对应的一级块索引项,每个一级块索引项中保存有其对应的Segment的索引信息;每个Segment中包括一个以上单元(Unit)和一个二级块索引表,二级块索引表中保存有每个Unit对应的二级块索引项,每个二级块索引项中保存有其对应的Unit的索引信息;每个Unit中包括一个以上的数据块(Chunk),每个Chunk对应一个记录;根据索引信息对分布式数据仓库进行访问。应用本发明所述方案,能够方便用户使用,且能够节省存储空间和提高数据的安全性。 |
申请公布号 |
CN102385606A |
申请公布日期 |
2012.03.21 |
申请号 |
CN201010274687.X |
申请日期 |
2010.09.03 |
申请人 |
腾讯科技(深圳)有限公司 |
发明人 |
洪坤乾;郭玮;李均;张书彬;赵伟;徐钊 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京德琦知识产权代理有限公司 11018 |
代理人 |
谢安昆;宋志强 |
主权项 |
一种分布式数据仓库的访问方法,其特征在于,该方法包括:将接收到的每个文本格式的文件转换为结构化格式,并进行存储;每个结构化格式的文件中包括一个文件头Head、一个以上数据段Segment以及一个一级块索引表,所述一级块索引表中保存有每个Segment对应的一级块索引项,每个一级块索引项中保存有其对应的Segment的索引信息;每个Segment中包括一个以上单元Unit以及一个二级块索引表,所述二级块索引表中保存有每个Unit对应的二级块索引项,每个二级块索引项中保存有其对应的Unit的索引信息;每个Unit中包括一个以上的数据块Chunk,每个Chunk对应一条记录;根据所述索引信息对所述分布式数据仓库进行访问。 |
地址 |
518044 广东省深圳市福田区振兴路赛格科技园2栋东403室 |