发明名称 |
一种支持ANSI编码的中文文本的压缩方法 |
摘要 |
本发明提供一种支持ANSI编码的中文文本的压缩方法以及相应的解压缩方法,该压缩方法包括下列步骤:根据待压缩中文文本中的字符在字符码表中的位置,将所述待压缩中文文本中的字符分别用1个或多个字节编码,且在生成的码字中标识所述字节个数,其中,所述字符码表包括根据所述待压缩中文文本中的字符的出现频率的降序所排列的字符;将生成的码字写入压缩文件。本发明最大限度地保持了中文数据流的语义特征,并且能与各种压缩算法、压缩软件配合使用。 |
申请公布号 |
CN101350624B |
申请公布日期 |
2011.05.04 |
申请号 |
CN200810119940.7 |
申请日期 |
2008.09.11 |
申请人 |
中国科学院计算技术研究所 |
发明人 |
云晓春;王树鹏;罗浩;常为领;吴广君;李书豪 |
分类号 |
H03M7/30(2006.01)I;G06F17/22(2006.01)I |
主分类号 |
H03M7/30(2006.01)I |
代理机构 |
北京泛华伟业知识产权代理有限公司 11280 |
代理人 |
王勇 |
主权项 |
一种支持美国国家标准协会(ANSI)编码的中文文本的压缩方法,包括下列步骤:100)根据待压缩中文文本中的字符在字符码表中的位置,将所述待压缩中文文本中的字符分别用1个或多个字节进行编码,对于出现频率高的字符用1个字节编码,对于出现频率低的字符用2或3个字节编码,其中,所述字符码表包括根据所述待压缩中文文本中的字符的出现频率的降序所排列的字符;300)将生成的码字写入压缩文件。 |
地址 |
100190 北京市海淀区中关村科学院南路6号 |