发明名称 一种面向大数据的云容灾备份方法
摘要 本发明公开的一种面向大数据的云容灾备份方法,包含以下步骤:建立文件块哈希指纹和快照指针实现对文件不同版本的压缩存储备份,同时将文件块指纹传输给私有云存储系统;私有云建立文件块指纹索引数据库,通过MapReduce任务比对哈希指纹来对传输块进行初步去重,对数据块进行细粒度的基于内容的再次分块哈希,通过另一个MapReduce子任务计算数据块的相似度矩阵和块指针分布,统计数据块的访问热度,并将指纹索引数据库与热数据缓存在存储前段,将冷数据以及归档备份数据集中存储并建立版本快照,定时备份在公有云存储系统。本发明的方法,通过缓存指纹库和热数据解决了传统容灾备份中的数据去重技术实时性较差等问题。
申请公布号 CN104932956A 申请公布日期 2015.09.23
申请号 CN201510350060.0 申请日期 2015.06.19
申请人 华南理工大学 发明人 林伟伟;张子龙;钟坯平
分类号 G06F11/14(2006.01)I 主分类号 G06F11/14(2006.01)I
代理机构 广州市华学知识产权代理有限公司 44245 代理人 陈宏升
主权项 一种面向大数据的云容灾备份方法,其特征在于,包含以下顺序的步骤:客户端通过建立文件块哈希指纹和快照指针实现对文件不同版本的压缩存储备份,同时客户端将文件块指纹传输给私有云存储系统;私有云建立文件块指纹索引数据库,通过MapReduce任务比对哈希指纹来对传输块进行初步去重,对数据块进行细粒度的基于内容的再次分块哈希,通过另一个MapReduce子任务计算数据块的相似度矩阵和块指针分布,由HDFS统计数据块的访问热度,并将指纹索引数据库与热数据缓存在存储前段,将冷数据以及归档备份数据集中存储并建立版本快照,定时备份在公有云存储系统实现异地容灾。
地址 510640 广东省广州市天河区五山路381号