发明名称 重复数据的处理方法
摘要 本发明公开一种重复数据的处理方法,从客户端接收查询请求,其中查询请求包括请求指纹值。接着于内存中对应请求指纹值的哈希区块搜寻请求指纹值。当对应请求指纹值的哈希区块不存在请求指纹值时,执行以下步骤:于内存中的新增表搜寻请求指纹值;以及当新增表中存在请求指纹值时,发送无效重复信息给客户端。
申请公布号 CN102810107B 申请公布日期 2015.10.07
申请号 CN201110157707.X 申请日期 2011.06.01
申请人 英业达股份有限公司 发明人 朱明胜;陈志丰
分类号 G06F17/30(2006.01)I;G06F11/14(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京律诚同业知识产权代理有限公司 11006 代理人 梁挥;张燕华
主权项 一种重复数据的处理方法,其特征在于,包括:从一客户端接收一查询请求以欲备份一请求数据块,其中该查询请求包括代表该请求数据块的一请求指纹值;于一内存中对应该请求指纹值的一哈希区块搜寻该请求指纹值;以及当对应该请求指纹值的该哈希区块不存在该请求指纹值时,执行以下步骤:于该内存中的一新增表搜寻该请求指纹值,其中该新增表中纪录正在新增的数据块的储存指纹值,并通过该新增表确认哪些数据块还在传输中,而尚未完整储存于磁盘之中,其中依据该请求数据块计算该请求指纹值的算法与依据该数据块计算该储存指纹值的算法相同;以及当该新增表中存在该请求指纹值时,发送一无效重复信息给该客户端,其中,所述于该内存中对应该请求指纹值的该哈希区块搜寻该请求指纹值的步骤还包括:当有新的数据块新增完成,但该内存中不存在对应该请求指纹值的该数据块的该哈希区块时:不将对应的该哈希区块加载到该内存来更新其写入状态值,而是将新增完成的数据块的储存指纹值存入一储存完成表;于该内存中的储存完成表搜寻该请求指纹值;以及当该储存完成表中存在该请求指纹值时,更新该哈希区块的一写入状态值,并由该储存完成表中删除该请求指纹值,再于对应该请求指纹值的该哈希区块搜寻该请求指纹值,即在尚未更新其写入状态值的哈希区块需要被加载入内存时,才将写入状态值更新;当该储存完成表中不存在该请求指纹值时,直接于对应请求指纹值的哈希区块搜寻该请求指纹值;其中,该储存完成表中纪录完整储存于磁盘之中,但尚未将新增完成的信息更新一写入状态值的数据块的储存指纹值,以及当有数据块在磁盘中新增完成之后,先将该数据块的储存指纹值暂存于该储存完成表中。
地址 中国台湾台北市