发明名称 具有重复值的表的块压缩
摘要 公开了包括计算机程序产品的方法和装置,用于具有重复值的表的块压缩。总的来说,表示压缩后的数据列的值标识符可以被排序以使得重复值相邻,并且可以生成块字典。可以为每一个值标识符块生成块字典。每一个块字典可以包括块标识符的列表,其中每一个块标识符与一个值标识符相关联,并且对于块中的每一个唯一值存在块标识符。块可以具有标准的大小并且块字典可以重复使用于多个块。
申请公布号 CN101311930B 申请公布日期 2012.07.04
申请号 CN200810107937.3 申请日期 2008.05.21
申请人 SAP股份公司 发明人 弗朗兹·费尔伯;冈特·拉德斯托克;安德鲁·罗斯
分类号 G06F17/30(2006.01)I;H03M7/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京市柳沈律师事务所 11105 代理人 邵亚丽
主权项 一种用于数据压缩处理的计算机实施的方法,所述方法包括:根据基于字典的压缩来压缩数据列,所述压缩包括生成值标识符列,值标识符中的每一个表示所述数据列中的一个唯一值;对所述值标识符进行排序;为所述值标识符的每一个块生成块标识符的第一列表,所述生成包括:具有用于块中的每一个唯一值标识符的唯一块标识符;以及对于相同的块标识符具有相同的值标识符;生成块字典列,所述生成块字典列包括为每一个块生成块字典,所述块字典包括:块标识符的第二列表,每一个块标识符与一个值标识符相关联;以及块标识符,为所述第二列表中每一个唯一的块标识符的值而存在于所述块字典中;以及生成块偏移列,所述块偏移列的每一个值指示在块字典的列中块从其开始的偏移。
地址 德国瓦尔多夫