发明名称 一种差异化对比分块的优化方法
摘要 本发明提供一种差异化对比分块的优化方法,该方法基于rsync的算法对数据分块进行差异化比对的优化方法,对不同大小的块进行分类比对,减少比对次数,提高比对的效率,把差异化的块合并为大块,减少文件操作次数,提高系统性能。
申请公布号 CN104639606A 申请公布日期 2015.05.20
申请号 CN201410849426.4 申请日期 2014.12.29
申请人 曙光信息产业(北京)有限公司 发明人 周军;赵欢;张磊;赵晓杰;王亮;张晋锋;李帅
分类号 H04L29/08(2006.01)I 主分类号 H04L29/08(2006.01)I
代理机构 北京安博达知识产权代理有限公司 11271 代理人 徐国文
主权项 一种差异化对比分块的优化方法,其特征在于,该方法步骤如下:(1)从服务端取得文件A的当前版本的块信息队列或所有版本的块信息队列;(2)把文件A以N0、N1、N2…Nm由小至大的顺序分块,并按块大小分类,形成N0到Nm的队列;(3)本地文件B按N0的块大小分块并计算出每个块的总和校验码和md5值,从而得到块信息列表B0_block_list;(4)遍历B0_block_list,用rsync方法把遍历后的块信息与文件A的N0队列中的块信息作差异化对比;(5)把文件B中没有匹配的块组成临时文件B1,把文件B1按N1的块大小进行分块,并计算出每个块的总和校验码和md5值,从而得到B1_block_list;(6)遍历B1_block_list,用rsync方法把遍历后的块信息与文件A的N1队列中的块信息作差异化对比;(7)循环步骤(3)到步骤(6)以此类推直到以Nm为大小进行比对,找出文件B和文件A没有匹配的差异化块;(8)合并差异化块;(9)计算合并后的差异化块的总和校验码和md5值,得到有差异化块信息列表。
地址 100193 北京市海淀区东北旺西路8号院36号楼