发明名称 一种在线备份服务软件中的数据压缩方法
摘要 本发明公开了一种备份服务软件中的数据压缩方法,属于计算机存储备份服务和计算机数据压缩领域,目的在于提高存储备份服务的效率。在本发明中,提出了在客户端通过两级压缩策略来降低系统负载的方法。上层压缩即为全局压缩,对备份原始文件按照固定大小进行分块,计算每个块的hash值,将此hash值作为数据块的“身份证”,从而保证每个数据块在存储端全局范围内只有一份副本。下层压缩为块级,即通过压缩算法实现数据块内的压缩,进一步地减少了需要通过网络传输的数据量,节省带宽。两级压缩共同作用,不仅提高了备份服务的效率,减少了数据传输量,同时也提高了存储端空间的利用率。
申请公布号 CN101820426A 申请公布日期 2010.09.01
申请号 CN201010152284.8 申请日期 2010.04.22
申请人 华中科技大学 发明人 王桦;周可;索念;秦明康
分类号 H04L29/06(2006.01)I;H04L12/24(2006.01)I;G06F11/14(2006.01)I 主分类号 H04L29/06(2006.01)I
代理机构 华中科技大学专利中心 42201 代理人 曹葆青
主权项 一种在线备份服务软件中的数据压缩方法,其特征在于,该方法包括下述步骤:第1步客户端接收用户提交的备份请求,在向控制中心认证其合法性之后,通过控制中心得到用于连接存储端的信息;同时在本地生成备份信息文件,用于记录备份文件集中各备份文件的名字以及相应的hash列表项;第2步客户端按顺序依次取一个原始文件,将文件名添加到备份信息文件中,并按下述过程进行处理,所有原始文件处理完毕后转到第3步;(2.1)将原始文件按照固定大小分块,并顺序将分块后的原始文件数据读入缓冲区中;(2.2)计算缓冲区中数据块的hash值,并添加此hash值到hash列表项中;存储端判断hash值对应的数据块是否存在,将结果反馈回客户端。如果存在转步骤(2.4),否则进入步骤(2.3);(2.3)压缩数据块,然后传输压缩后的数据块到存储端;(2.4)判断待处理的原始文件的全部分块是否处理完毕,如果是,进入第2步,否则转入步骤(2.1);第3步打开备份信息文件,读取原始文件数据到缓冲区,计算hash值,将hash值传输到控制中心保存;第4步同时传输此hash值到存储端,存储端判断hash值对应的数据块是否存在,将结果反馈回客户端。如果存在转入第6步,否则进入第5步;第5步通过网络传输缓冲区数据到存储端;第6步备份完成,发送完成信号到控制中心和存储端。
地址 430074 湖北省武汉市洪山区珞喻路1037号