发明名称 基于值的出现的表压缩
摘要 公开了包括计算机程序产品的方法和装置,用于基于值的出现对表进行压缩。总体来说,生成表示在列的相邻行的组中频繁出现值的出现量的数量,生成表示在所述列的行中是否存在该频繁出现值的向量,并且存储所述数量和所述向量以实现对所述数量和所述向量所表示的数据的搜索。向量可以省略表示相邻行的组的部分。值可以是表示诸如业务对象的业务数据的基于字典的压缩值。压缩可以在存储器内并行执行,以改进存储器利用率、网络带宽消耗和处理性能。
申请公布号 CN101311931A 申请公布日期 2008.11.26
申请号 CN200810107938.8 申请日期 2008.05.21
申请人 SAP股份公司 发明人 弗朗兹·费尔伯;冈特·拉德斯托克;安德鲁·罗斯
分类号 G06F17/30(2006.01) 主分类号 G06F17/30(2006.01)
代理机构 北京市柳沈律师事务所 代理人 邵亚丽
主权项 1、一种计算机程序产品,有形地实现在计算机可读介质中,所述计算机程序产品可操作以使得数据处理装置执行操作,所述操作包括:生成基于字典的压缩值的列,所述基于字典的压缩值的列以基于列的数据库的每列的可能值的字典为基础,并且是结构化的业务数据;对所述列进行排序,以使得在所述列的顺序中排在第一的第一列具有的该第一列中的最频繁出现值比其它列的频繁出现值出现得更频繁;对所述第一列进行排序,以使得该第一列的最频繁出现值的实例位于该第一列的一端;对所述其它列中的至少一个进行排序,以使得所述其它列中的至少一个的最频繁出现值的实例朝向各个其它列的端部;生成用于所述列中的至少一个的比特向量,所述比特向量中的每一个表示各列的最频繁出现值,所述生成包括使比特向量的每个比特在最频繁出现值存在于相应列的相应行中时表示该最频繁出现值存在;生成用于具有相关联的比特向量的列中的每一个的数量,该数量表示列的一端的最频繁出现值的出现量;基于与比特向量相关联的数量,从比特向量的每一个中去除各个列的一端的最频繁出现值的表示;以及存储用于所述一个或多个比特向量的每一个的一个或多个数量,以实现对每一个所述数量和所述比特向量所表示的数据的非易失性存储器搜索。
地址 德国瓦尔多夫