发明名称 |
一种汉字编码的方法 |
摘要 |
本发明公开了一种汉字编码的方法。本发明的编码方法在GB 2312-80的基础上,对汉字的编码进行了根本改进,利用了汉字的特点,其特征在于对所有的汉字包括(日韩)和汉语符号采用4位16进制,编码空间从1000~FFFF;具体包括对汉字非成字部件的编码空间是1000~1999;对国标一级汉字和部分2级汉字的编码空间分配为2000~EFFF,F000~FFFF为空,为扩展编码区。这样的方法理论是能够满足百万汉字的编码,对于无论是“非成字部件(偏旁部首)+汉字”,或者“汉字+汉字”或者“非成字部件(偏旁部首)+非成字部件(偏旁部首)”等构成的汉字,分别取其各自的编码,来实现对该汉字的编码。该方法简单,快捷,节约了计算机的内存资源,提高了汉字的检索效率,比目前的unicode编码有巨大的优势,为树立国际标准提供了理论根据。 |
申请公布号 |
CN102243623A |
申请公布日期 |
2011.11.16 |
申请号 |
CN201010528090.3 |
申请日期 |
2010.11.02 |
申请人 |
泗阳天琴软件科技有限公司 |
发明人 |
潘文林 |
分类号 |
G06F17/22(2006.01)I |
主分类号 |
G06F17/22(2006.01)I |
代理机构 |
|
代理人 |
|
主权项 |
一种汉字编码的方法,其基本汉字的编码采用4位十六进制编码,汉字的部件/偏旁部首(非成字)部分采用编码6001~6999,其特征在于,对于有1个汉字元和汉字构成的汉字,其编码采用8位十六进制编码,其中低4位采用构成该汉字的字元编码,高4位采用构成该汉字的汉字编码;对于有1个汉字元和汉字部件/部首构成的汉字,其编码采用8位十六进制编码,其中低4位采用构成该汉字的字元编码,高4位采用构成该汉字的部件/部首编码。 |
地址 |
223700 江苏省宿迁市泗阳县丰泰机电城F2栋204 |