发明名称 重复数据删除的数据区块切分方法与新增方法
摘要 本发明公开了一种重复数据删除的数据区块切分方法与新增方法将输入文件进行文件切割为多个数据区块。切分方法包括:利用固定长度的滑动窗口在输入文件中移动,记录输入文件的起始位置,另记录滑动窗口位于输入文件的尾端位置,将起始位置与尾端位置间的长度定义为分块长度;根据滑动窗口对输入文件的固定长度的所涵盖范围进行指纹特征程序,产生指纹特征值;重复滑动窗口的移动,直至滑动窗口符合切分条件时;根据各分块长度产生相应的数据区块,并重复执行产生数据区块的步骤,直至完成输入文件中的所有数据区块为止,且产生指纹特征值的索引文件。
申请公布号 CN102467571A 申请公布日期 2012.05.23
申请号 CN201010564586.6 申请日期 2010.11.17
申请人 英业达股份有限公司 发明人 朱明胜;王云松;陈志丰
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京律诚同业知识产权代理有限公司 11006 代理人 梁挥;祁建国
主权项 一种重复数据删除的数据区块切分方法,应用在一文件备份程序中,用以将一输入文件进行文件切割为多个数据区块,其特征在于,包括以下步骤:载入该输入文件;利用一固定长度的一滑动窗口在该输入文件中循序移动,并记录该滑动窗口于该输入文件的一起始位置,且同时记录当前该滑动窗口位于该输入文件的一尾端位置,将该起始位置与该尾端位置间的长度定义为一分块长度;根据该滑动窗口对该输入文件的该固定长度的所涵盖范围进行一指纹特征程序,用以产生一指纹特征值;重复该滑动窗口的移动,直至该滑动窗口符合一切分条件时,则停止该滑动窗口的移动,再根据该输入文件的该分块长度产生相应的该数据区块;以及依据该滑动窗口在前一该数据区块的该尾端位置作为新的该滑动窗口的该起始位置,并重复执行产生该数据区块的步骤,直至完成该输入文件中的所有该些数据区块为止,且产生该些指纹特征值的一索引文件。
地址 中国台湾台北市