发明名称 文本文件数据压缩的无损变换
摘要 本发明涉及一种文本文件数据压缩的W-变换,其方法特征是,对于源码为ASCII码的,其源码高位置1,对于不能组成中文词组的单字和图形符号,将其划分为页,对其变换后,其编码第一字节:是页码+1,编码第二字节:该页在汉字库中的偏移地址,对于能组成中文词组的双字词组,是将词组划分为页,每页变换后的编码是采用页码和其在汉字库中的偏移地址。应用本发明可大大提高对中西文文本文件的压缩比。
申请公布号 CN1191355A 申请公布日期 1998.08.26
申请号 CN97108546.3 申请日期 1997.12.08
申请人 王国安 发明人 王国安
分类号 G06F17/21;H03M7/30 主分类号 G06F17/21
代理机构 汉中地区专利事务所 代理人 冯涛
主权项 1、一种文本文件数据压缩的W-变换,实现其的方法特征在于,1).对于源码为ASCII码的,其源码高位置1,2).对于源码为换行符即其ASCII码为0D,0A的,将其变换后,置为0x81H,3).对于汉字“的”,变换后将其置为0x82H,4).对于不能组成中文词组的单字和图形符号,将其划分为页,每页256个汉字,对其变换后,其编码第一字节:是页码+1,编码第二字节:该页在汉字库中的偏移地址,5).对于能组成中文词组的双字词组,是将词组划分为页,每页256个词组,变换后的编码第一字节是页码+4)中所述的单字划分为页后所占的总页码,编码第二字节是其在汉字库中的偏移地址。
地址 723000陕西省汉中市汉中师范学院数学系