发明名称 |
一种列存数据库的数据压缩方法及装置 |
摘要 |
本发明旨在提供一种在列存储数据库中自适应的智能压缩方法。包括,多种压缩算法构成的复合压缩引擎,对一列中的数据进行抽样分析特征,按照特征缩减压缩引擎中备选算法的范围,通过采样压缩的方式选定压缩算法,以及同一压缩方法的步长控制防止抽样异常造成整列压缩效果不佳。本发明可以在列存数据库中对存储数据进行有效的压缩,通过复合算法引擎适应不同的数据。而数据抽样以及采样可以有效的在相近算法中做出选择,避免了传统复合算法下追求压缩比而造成的过量计算,兼顾压缩速度与压缩比的综合结果。 |
申请公布号 |
CN104462334A |
申请公布日期 |
2015.03.25 |
申请号 |
CN201410727736.9 |
申请日期 |
2014.12.03 |
申请人 |
天津南大通用数据技术股份有限公司 |
发明人 |
刘威;鹿明;武新;崔维力 |
分类号 |
G06F17/30(2006.01)I;H03M7/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
天津滨海科纬知识产权代理有限公司 12211 |
代理人 |
杨慧玲 |
主权项 |
一种列存数据库的数据压缩方法,其特征在于,包括如下步骤:(1)多种压缩算法构建压缩引擎并分类;(2)数据采样分析,找到相应的压缩算法分类;(3)选定列存数据的步长并抽样,使用压缩算法分类中的各压缩算法进行压缩;(4)评估压缩结果,选定一种压缩算法;(5)对步长范围内的数据都采用步骤(4)确认的压缩算法进行处理;(6)取得下一步长的数据从步骤(2)开始循环。 |
地址 |
300384 天津市滨海新区高新区华苑产业区海泰发展六道6号海泰绿色产业基地J-518 |