发明名称 |
提高线上重复删除效率的方法和系统 |
摘要 |
本发明涉及提高线上重复删除效率的方法和系统,具体提供一种在计算环境中提高线上重复删除效率的方法。在一个实施例中,仅作为例子,在第n次迭代中对于来自从请求线上重复删除的对象提取的固定尺寸数据块的数据采样计算散列值。对于第n次迭代中的每一次,使在第n个散列索引表中对于来自固定尺寸数据块的数据采样计算的散列值与存储部件中的存在的对象的相应的散列值匹配。当在匹配过程中检测到不匹配时,离开第n个散列索引表,不匹配被确定为是唯一对象并被存储。计算对象的散列值。用计算的对象的散列值和计算的唯一对象的散列值更新主散列索引表。 |
申请公布号 |
CN103365954A |
申请公布日期 |
2013.10.23 |
申请号 |
CN201310113525.1 |
申请日期 |
2013.04.03 |
申请人 |
国际商业机器公司 |
发明人 |
D·M·巴尔德温;N·P·博塞尔;J·T·奥尔森;S·R·派迪尔 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
中国国际贸易促进委员会专利商标事务所 11038 |
代理人 |
党建华 |
主权项 |
一种在计算环境中通过处理器装置提高线上重复删除效率的方法,该方法包括:在第n次迭代中对于来自从请求线上重复删除的对象提取的固定尺寸数据块的数据采样计算散列值;对于第n次迭代中的每一次,使在第n个散列索引表中对于来自固定尺寸数据块的数据采样计算的散列值与存储部件中的存在的对象的相应的散列值匹配,其中,第n个散列索引表是对于属于固定数据块的数据采样的每一个构建的;在检测到在匹配过程中对于来自固定尺寸数据块的数据采样的每一个计算的散列值不匹配的情况下,离开第n个散列索引表,其中,不匹配被确定为是唯一对象并被存储;和计算对象的散列值,其中,用计算的对象的散列值和计算的唯一对象的散列值更新主散列索引表。 |
地址 |
美国纽约 |