发明名称 |
一种重复数据处理技术 |
摘要 |
本发明公开了一种重复数据处理技术,包括两种方法分别为:静态的切分文件和动态的切分文件,所述静态的切分文件是将文件按照固定大小来切分,所述动态的切分文件包括以下步骤:首先按照一定的算法来查找数据块的边界位置;然后解决数据指纹;接着用数据指纹来判断两个数据块是否相同;将相同数据块存储一份,并存储相同数据块的索引值,以便恢复时所用。采用本发明技术方案,可以减少数据对存储容量的需求,同时在深入研究容灾备份中存储容量优化技术的基础上,对重复数据删除技术进行了一定的技术改进,实现了高质量的存储。 |
申请公布号 |
CN103473278A |
申请公布日期 |
2013.12.25 |
申请号 |
CN201310378916.6 |
申请日期 |
2013.08.28 |
申请人 |
苏州天永备网络科技有限公司 |
发明人 |
曹峰 |
分类号 |
G06F17/30(2006.01)I;G06F11/14(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
南京经纬专利商标代理有限公司 32200 |
代理人 |
曹毅 |
主权项 |
一种重复数据处理技术,其特征在于,包括两种方法分别为:静态的切分文件和动态的切分文件,所述静态的切分文件是将文件按照固定大小来切分,所述动态的切分文件包括以下步骤:步骤1)按照一定的算法来查找数据块的边界位置;步骤2)解决数据指纹,即将文件切割成多个小模块后,需要给每个小数据块计算出数据指纹;步骤3)用数据指纹来判断两个数据块是否相同;在查找数据块,由于数据块数量众多,采用基于函数形式的HASH查找方法,可以有效缩短查找时间; 步骤4)将相同数据块存储一份,并存储相同数据块的索引值,以便恢复时所用。 |
地址 |
215000 江苏省苏州市木渎镇中山东路70号2506室 |