发明名称 |
电子文档增量存储处理方法 |
摘要 |
本发明涉及一种电子文档编辑后生成增量文档的方法,包括:从参考文档中将数据读入内存并划分;计算划分出的参考数据块对应的索引值,并进行关联;依次将编辑后数据块读入内存,并计算对应的索引值;将参考数据块对应的索引值与编辑后数据块对应的索引值进行比较,匹配则将参考文档匹配的位置以及匹配标记写入增量文档,否则将编辑后文档中不匹配段、不匹配长度以及不匹配标记写入该增量文档。本发明还涉及一种根据增量文档恢复编辑后文档的方法。本发明通过对编辑前后的两个文档进行比较建立映射关系,再根据记录的映射关系生成增量文档,在数据存储、归档、备份等方面只需要处理增量文档来替代处理编辑后文档,以次减少存储或网络传输的负担。 |
申请公布号 |
CN101482839B |
申请公布日期 |
2010.09.29 |
申请号 |
CN200910078365.5 |
申请日期 |
2009.02.26 |
申请人 |
北京世纪互联宽带数据中心有限公司 |
发明人 |
蒋建平;杨耀敏 |
分类号 |
G06F11/14(2006.01)I;G06F17/30(2006.01)I |
主分类号 |
G06F11/14(2006.01)I |
代理机构 |
中国国际贸易促进委员会专利商标事务所 11038 |
代理人 |
颜镝 |
主权项 |
一种电子文档编辑后生成增量文档的方法,包括以下步骤:从参考文档中将预设容量V的数据读入内存,并以预设长度L划分读入的数据,所述参考文档为每次编辑前的文档;如果参考文档的容量低于预设容量V,则读取所述参考文档的数据直到结尾;计算划分出的每个参考数据块对应的索引值,并将所述索引值与对应的参考数据块进行关联;从编辑后文档中依次将预设长度L的编辑后数据块读入内存,并计算对应的索引值,所述编辑后文档为每次编辑后的文档;将每次读取的参考数据块对应的索引值与读取的各个编辑后数据块对应的索引值进行比较,如果匹配则将所述参考文档匹配的位置以及匹配标记写入增量文档,否则将所述编辑后文档中不匹配段、不匹配长度以及不匹配标记写入该增量文档,所述增量文档为根据参考文档对编辑后文档增量分析后生成的新文档;在读取的参考数据块对应的索引值与读取的各个编辑后数据块对应的索引值匹配时,清除内存中所述参考文档匹配的位置及该位置之前的数据,并追加所述参考文档中未读入的数据,并满足预设容量V,如果所述参考文档中未读入的数据在追加后容量仍低于预设容量V,则读取所述参考文档的数据直到结尾;在将所述编辑后文档中不匹配段、不匹配长度以及不匹配标记写入该增量文档时,如果不匹配长度大于预设不匹配长度Lp时,则按照所述预设不匹配长度Lp分为多个不匹配段,并写入该增量文档。 |
地址 |
100016 北京市朝阳区酒仙桥东路1号M5楼三层 |