发明名称 一种分布式数据仓库的访问方法和装置
摘要 本发明提供了一种分布式数据仓库的访问方法和装置:将接收到的每个文本格式的文件转换为结构化格式,并进行存储;每个结构化格式的文件中包括一个文件头(Head)、一个以上数据段(Segment)以及一个一级块索引表,一级块索引表中保存有每个Segment对应的一级块索引项,每个一级块索引项中保存有其对应的Segment的索引信息;每个Segment中包括一个以上单元(Unit)和一个二级块索引表,二级块索引表中保存有每个Unit对应的二级块索引项,每个二级块索引项中保存有其对应的Unit的索引信息;每个Unit中包括一个以上的数据块(Chunk),每个Chunk对应一个记录;根据索引信息对分布式数据仓库进行访问。应用本发明所述方案,能够方便用户使用,且能够节省存储空间和提高数据的安全性。
申请公布号 CN102385606A 申请公布日期 2012.03.21
申请号 CN201010274687.X 申请日期 2010.09.03
申请人 腾讯科技(深圳)有限公司 发明人 洪坤乾;郭玮;李均;张书彬;赵伟;徐钊
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京德琦知识产权代理有限公司 11018 代理人 谢安昆;宋志强
主权项 一种分布式数据仓库的访问方法,其特征在于,该方法包括:将接收到的每个文本格式的文件转换为结构化格式,并进行存储;每个结构化格式的文件中包括一个文件头Head、一个以上数据段Segment以及一个一级块索引表,所述一级块索引表中保存有每个Segment对应的一级块索引项,每个一级块索引项中保存有其对应的Segment的索引信息;每个Segment中包括一个以上单元Unit以及一个二级块索引表,所述二级块索引表中保存有每个Unit对应的二级块索引项,每个二级块索引项中保存有其对应的Unit的索引信息;每个Unit中包括一个以上的数据块Chunk,每个Chunk对应一条记录;根据所述索引信息对所述分布式数据仓库进行访问。
地址 518044 广东省深圳市福田区振兴路赛格科技园2栋东403室