一种基于网络字典的无损数据压缩方法,申请号CN201310225049.2-传众专利搜索

发明名称	一种基于网络字典的无损数据压缩方法
摘要	本发明涉及一种基于网络字典的无损数据压缩方法，其中网络字典是指服务器端保存的字典，包括标准字典、扩展字典、私有字典三部分。客户端通过标准字典和私有字典，可在原始文件和目标文件中转换，完成压缩和解压的过程，扩展字典的存在便于优化标准字典。本压缩方法采用了远程服务器保存字典，节省了本地字典的空间，提高了压缩效率，压缩算法和字典维护算法综合考虑了时间和空间复杂度，以简单的运算实现了较高的压缩效率，同时压缩算法可根据文件类型不同，采用不同字典，强化了字典针对性，提高了压缩效率。
申请公布号	CN103347047B	申请公布日期	2017.02.08
申请号	CN201310225049.2	申请日期	2013.06.07
申请人	南京交通职业技术学院	发明人	吴昊;曾杰杰;高水娟;李莉;宫鼎
分类号	H04L29/08(2006.01)I	主分类号	H04L29/08(2006.01)I
代理机构	南昌新天下专利商标代理有限公司 36115	代理人	施秀瑾
主权项	一种基于网络字典的无损数据压缩方法,包括网络字典，其特征在于，所述方法包括字典维护、压缩方法、解压方法，所述压缩方法包括：1）在服务器中创建私有字典，在目标文件中注明字典版本号和私有字典编号；2）根据字典中串长度的构成方法顺序遍历原始文件，用标准字典中对应的“编码+重复次数”置换，生成过程文件，并根据标准字典中各串的使用次数，更新标准字典中的引次；3）将过程文件中未能用编码替换的串编制成私有字典，根据其引次，采用霍夫曼算法生成相应的编码，保存到服务器中私有字典中；4）用私有字典中的“编码+重复次数”置换过程文件中未置换成编码的串，生成目标文件；5）在将串转化为“编码+重复次数”的过程中，如果重复次数为0，则重复次数省略，如重复次数为大于0的数值，则判断采用“编码+编码+……+编码”方式与“编码+重复次数”方式哪种数据量更小，就采用哪种；所述解压方法包括：1）读取目标文件中的版本号和私有字典编号，连接服务器，获取版本号和私有字典编号所对应的标准字典和私有字典；2）利用标准字典和私有字典中编码和串的对应关系，将目标文件中的“编码+重复次数”还原成串，生成原始文件；所述标准字典和扩展字典维护方法包括：1）标准字典的表项长度因原始文件类型不同而定；2）每次压缩后，均将压缩过程中所有串的重复次数作为表项分别放入标准字典和扩展字典中；3）定期将扩展字典中的表项和标准字典中的表项合并，选出引次最高的部分，采用霍夫曼算法重新编码，生成新的标准字典，未入选标准字典的表项放入新的扩展字典中，创建新版本编号，得到新版本标准字典和扩展字典；其中标准字典、私有字典、扩展字典定义如下：标准字典：当前版本号使用的字典，所有使用此版本字典进行压缩的原始文件共同使用，包括三个字段串、编码、引次；私有字典：每一个原始文件对应一个私有字典，以字典版本号原始文件的编号作为私有字典的名称，私有字典由原始文件中无法在标准字典中找到对应编码的串和该串对应的编码所构成，包括两个字段串、编码；扩展字典：包含本版本中所有私有字典中的串和各串对应的引次，包括两个字段串、引次。
地址	210000 江苏省南京市南京科学园龙眠大道629号