发明名称 | 文本文件数据压缩的无损变换 | ||
摘要 | 本发明涉及一种文本文件数据压缩的W-变换,其方法特征是,对于源码为ASCII码的,其源码高位置1,对于不能组成中文词组的单字和图形符号,将其划分为页,对其变换后,其编码第一字节:是页码+1,编码第二字节:该页在汉字库中的偏移地址,对于能组成中文词组的双字词组,是将词组划分为页,每页变换后的编码是采用页码和其在汉字库中的偏移地址。应用本发明可大大提高对中西文文本文件的压缩比。 | ||
申请公布号 | CN1191355A | 申请公布日期 | 1998.08.26 |
申请号 | CN97108546.3 | 申请日期 | 1997.12.08 |
申请人 | 王国安 | 发明人 | 王国安 |
分类号 | G06F17/21;H03M7/30 | 主分类号 | G06F17/21 |
代理机构 | 汉中地区专利事务所 | 代理人 | 冯涛 |
主权项 | 1、一种文本文件数据压缩的W-变换,实现其的方法特征在于,1).对于源码为ASCII码的,其源码高位置1,2).对于源码为换行符即其ASCII码为0D,0A的,将其变换后,置为0x81H,3).对于汉字“的”,变换后将其置为0x82H,4).对于不能组成中文词组的单字和图形符号,将其划分为页,每页256个汉字,对其变换后,其编码第一字节:是页码+1,编码第二字节:该页在汉字库中的偏移地址,5).对于能组成中文词组的双字词组,是将词组划分为页,每页256个词组,变换后的编码第一字节是页码+4)中所述的单字划分为页后所占的总页码,编码第二字节是其在汉字库中的偏移地址。 | ||
地址 | 723000陕西省汉中市汉中师范学院数学系 |