发明名称 一种基于因果关系的重复数据删除方法
摘要 本发明提供了一种基于因果关系的重复数据删除方法,该方法根据所捕捉的数据文件之间的因果关系,消除备份和恢复任务中的重复数据,从而加快了备份和恢复数据的传输,提高了云备份系统中数据备份和恢复的速度,使云备份系统切实可用。
申请公布号 CN102184218A 申请公布日期 2011.09.14
申请号 CN201110115298.7 申请日期 2011.05.05
申请人 华中科技大学 发明人 冯丹;谭玉娟;田磊;许蔚;晏志超
分类号 G06F17/30(2006.01)I;G06F11/14(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 华中科技大学专利中心 42201 代理人 李智
主权项 一种基于因果关系的重复数据删除方法,涉及文件关系表和文件指纹谱集,所述文件关系表包含文件名、文件操作类型和文件操作时间信息,所述文件指纹谱集包含各文件的文件数据块指纹和文件备份时间信息;该方法包括数据备份步骤和数据恢复步骤;所述数据备份步骤,具体为:(A1)本地客户端接受用户备份任务请求,备份任务请求携带的信息有待备份文件名和最近一次备份时间;(A2)查询文件关系表,判断待备份文件是否在最近一次备份时间之后进行过修改,若是,则进入步骤(A3),否则,结束备份;(A3)提取待备份文件当前的数据块指纹,将其与文件指纹谱集记录的待备份文件最后一次备份时的数据块指纹进行匹配,找出匹配失败的数据块;(A4)对步骤(A3)中匹配失败的数据块进行备份;(A5)在文件指纹谱集记录待备份文件当前的数据块指纹和备份时间;所述数据恢复步骤,具体为:(B1)本地客户端接收用户恢复任务请求,恢复任务请求携带的信息有待恢复文件的文件名和待恢复时间点;(B2)查询文件关系表,判断待恢复文件是否在离待恢复时间点的最近一次备份后进行过修改,若是,则进入步骤(B3),否则,结束恢复;(B3)提取待恢复文件当前的数据块指纹;(B4)从文件指纹谱集中查询待恢复文件离待恢复时间点最近一次备份的数据块指纹,将其与步骤(B3)提取的数据块指纹进行匹配,找出匹配失败的数据块;(B5)对步骤(B4)中匹配失败的数据块进行恢复。
地址 430074 湖北省武汉市洪山区珞喻路1037号