发明名称 在数据库系统中减少存储需求的数据压缩
摘要 本发明公开了在数据库系统中减少数据存储需求的方法、系统和计算机程序产品。一个实施例包括:基于预定的阈值水平和压缩边界,确定将被压缩的数据库数据的至少一行中拥有固定长度数据类型的至少一个候选数据;根据压缩的边界在至少一个行内为已确定的候选数据提供至少一个位元;和在数据库系统中存储该至少一行作为压缩数据。该将被压缩的已确定的候选数据包括固定长度的列,该列的长度不低于一行数据中预定的阈值水平,并且该至少一个位元包括该将被压缩的已确定的候选数据的长度的位元图。对于基于页边界的压缩,该将被压缩的已确定的候选数据包括在数据页中的冗余位元组字符串数据,该冗余位元组字符串数据包括匹配在多列之间长度不超过预定阈值水平的数据。
申请公布号 CN102804168B 申请公布日期 2016.03.09
申请号 CN201080027310.2 申请日期 2010.06.17
申请人 赛贝斯股份有限公司 发明人 杨新军;钱旭东
分类号 G06F17/00(2006.01)I;G06F9/06(2006.01)I;G06F17/20(2006.01)I;G06F17/30(2006.01)I 主分类号 G06F17/00(2006.01)I
代理机构 北京市柳沈律师事务所 11105 代理人 邵亚丽
主权项 一种在数据库系统中减少数据存储需求的方法,包括:在列位置的拥有没压缩行格式的数据中的至少一行中,确定被指定为固定长度数据类型属性的列数据的至少一个候选数据以进行压缩,所述确定步骤基于:预定的阈值,所述预定的阈值配置以根据数据类型属性来确定拥有固定长度数据类型的可压缩列数据;和压缩边界;根据压缩的边界,在所述至少一行内为已确定的候选数据提供至少一个位元,其中,通过把至少一个固定长度的数据类型改变为可变的长度来进行行数据压缩时,利用偏移数据来表示可变长度列,并且使用位元图来映像出一行中可变长度列的长度;和在数据库系统中,把包含所述至少一个位元的所述至少一行和所述已确定的候选数据存储为压缩数据,所述压缩数据拥有置于数据库系统内的列的压缩行格式,其中所述至少一行的所述压缩行格式基于所述已确定的候选数据从所述没压缩行格式被重置,其中被确定将被压缩的候选数据包括基于页边界压缩的数据页中的冗余位元组字符串数据。
地址 美国加利福尼亚州