发明名称 |
一种差异化对比分块的优化方法 |
摘要 |
本发明提供一种差异化对比分块的优化方法,该方法基于rsync的算法对数据分块进行差异化比对的优化方法,对不同大小的块进行分类比对,减少比对次数,提高比对的效率,把差异化的块合并为大块,减少文件操作次数,提高系统性能。 |
申请公布号 |
CN104639606A |
申请公布日期 |
2015.05.20 |
申请号 |
CN201410849426.4 |
申请日期 |
2014.12.29 |
申请人 |
曙光信息产业(北京)有限公司 |
发明人 |
周军;赵欢;张磊;赵晓杰;王亮;张晋锋;李帅 |
分类号 |
H04L29/08(2006.01)I |
主分类号 |
H04L29/08(2006.01)I |
代理机构 |
北京安博达知识产权代理有限公司 11271 |
代理人 |
徐国文 |
主权项 |
一种差异化对比分块的优化方法,其特征在于,该方法步骤如下:(1)从服务端取得文件A的当前版本的块信息队列或所有版本的块信息队列;(2)把文件A以N0、N1、N2…Nm由小至大的顺序分块,并按块大小分类,形成N0到Nm的队列;(3)本地文件B按N0的块大小分块并计算出每个块的总和校验码和md5值,从而得到块信息列表B0_block_list;(4)遍历B0_block_list,用rsync方法把遍历后的块信息与文件A的N0队列中的块信息作差异化对比;(5)把文件B中没有匹配的块组成临时文件B1,把文件B1按N1的块大小进行分块,并计算出每个块的总和校验码和md5值,从而得到B1_block_list;(6)遍历B1_block_list,用rsync方法把遍历后的块信息与文件A的N1队列中的块信息作差异化对比;(7)循环步骤(3)到步骤(6)以此类推直到以Nm为大小进行比对,找出文件B和文件A没有匹配的差异化块;(8)合并差异化块;(9)计算合并后的差异化块的总和校验码和md5值,得到有差异化块信息列表。 |
地址 |
100193 北京市海淀区东北旺西路8号院36号楼 |