发明名称 一种列存数据库的数据压缩方法及装置
摘要 本发明旨在提供一种在列存储数据库中自适应的智能压缩方法。包括,多种压缩算法构成的复合压缩引擎,对一列中的数据进行抽样分析特征,按照特征缩减压缩引擎中备选算法的范围,通过采样压缩的方式选定压缩算法,以及同一压缩方法的步长控制防止抽样异常造成整列压缩效果不佳。本发明可以在列存数据库中对存储数据进行有效的压缩,通过复合算法引擎适应不同的数据。而数据抽样以及采样可以有效的在相近算法中做出选择,避免了传统复合算法下追求压缩比而造成的过量计算,兼顾压缩速度与压缩比的综合结果。
申请公布号 CN104462334A 申请公布日期 2015.03.25
申请号 CN201410727736.9 申请日期 2014.12.03
申请人 天津南大通用数据技术股份有限公司 发明人 刘威;鹿明;武新;崔维力
分类号 G06F17/30(2006.01)I;H03M7/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 天津滨海科纬知识产权代理有限公司 12211 代理人 杨慧玲
主权项 一种列存数据库的数据压缩方法,其特征在于,包括如下步骤:(1)多种压缩算法构建压缩引擎并分类;(2)数据采样分析,找到相应的压缩算法分类;(3)选定列存数据的步长并抽样,使用压缩算法分类中的各压缩算法进行压缩;(4)评估压缩结果,选定一种压缩算法;(5)对步长范围内的数据都采用步骤(4)确认的压缩算法进行处理;(6)取得下一步长的数据从步骤(2)开始循环。
地址 300384 天津市滨海新区高新区华苑产业区海泰发展六道6号海泰绿色产业基地J-518