发明名称 |
对数据去除重复的方法和系统 |
摘要 |
提供一种方法、系统和计算机程序产品用于对数据去除重复:将选择的数据的多个文件块映射到多个逻辑块;对所述多个逻辑块去除重复,从而将每个逻辑块与位于物理存储器设备上的多个物理块的对应物理块相关联,所述对应物理块中的两个或更多是彼此非连续的;确定所述对应物理块中的一个或多个是否是以阈值频率以上的频率存取、并由应用的公共集合引用的一个或多个频繁存取的物理块;以及将存储在所述一个或多个频繁存取的物理块上的数据重新定位到所述多个物理块的不同物理块,所述多个物理块的不同物理块是物理连续的。 |
申请公布号 |
CN104679445A |
申请公布日期 |
2015.06.03 |
申请号 |
CN201410001102.5 |
申请日期 |
2014.01.02 |
申请人 |
国际商业机器公司 |
发明人 |
D.M.鲍德温;C.巴雷拉;M.C.康斯坦丁斯库;S.R.帕蒂尔;R.M.希拉古皮 |
分类号 |
G06F3/06(2006.01)I;G06F17/30(2006.01)I |
主分类号 |
G06F3/06(2006.01)I |
代理机构 |
北京市柳沈律师事务所 11105 |
代理人 |
周少杰 |
主权项 |
一种对数据去除重复的方法,包括:将选择的数据的多个文件块映射到多个逻辑块;对所述多个逻辑块去除重复,从而将每个逻辑块与位于物理存储器设备上的多个物理块的对应物理块相关联,所述对应物理块中的两个或更多是彼此非连续的;确定所述对应物理块中的一个或多个是否是以阈值频率以上的频率存取、并由应用的公共集合引用的一个或多个频繁存取的物理块;以及将存储在所述一个或多个频繁存取的物理块上的数据重新定位到所述多个物理块的不同物理块,所述多个物理块的不同物理块是物理连续的。 |
地址 |
美国纽约阿芒克 |