发明名称 基于中文字母方式描述汉字轮廓特征的多元编码方法
摘要 本发明是一种用于计算机和电子通信设备中文信息处理的多元汉字编码输入方法。该方法科学地设计了26个类似拉丁字母的汉字构字部件,建立一套描述汉字字形的中文编码字母,构建一个适用于国家GB2312-80和GB18030-2000繁体、简体大字符集的汉字编码体系。采用一个相同的编码规则,通过键入拉丁字母和数字编码的形式描述汉字字形的轮廓特征,为人们提供一种不但能用拉丁字母或数字编码输入,同时还可以用字母数字混合编码的方式输入汉字的方法。
申请公布号 CN100514260C 申请公布日期 2009.07.15
申请号 CN200510052219.7 申请日期 2005.01.31
申请人 刘君度;刘冰彬;陈昌英 发明人 刘君度;刘冰彬;陈昌英
分类号 G06F3/023(2006.01)I;G06F17/28(2006.01)I 主分类号 G06F3/023(2006.01)I
代理机构 代理人
主权项 1、一种用于计算机和电子通信设备中文信息处理的汉字编码输入方法,该方 法的汉字编码由汉字的字形编码元素组成,其特征是: (1)所述汉字的字形编码由汉字的首形码、尾形码、补形码和特征码四个字形 编码元素组成,它们分别按照汉字三个角的笔形特征进行编码,对汉字字形码元的 约定意义是: 首形码为汉字左上角起笔的笔形特征的代码, 尾形码为汉字右下角末笔的笔形特征的代码, 补形码为汉字右上角最高的笔形特征的代码, 特征码是指去掉汉字右上角所取的补形码后,对余下部分再次取补形码; (2)所述汉字的字形编码元素为描述汉字字形轮廓特征的26个具有特定形态 意义的汉字部件,它们是从有共同形态特征的同类汉字部件和笔画中归纳出的一个 具有代表性的部件,部件的中文名称描述了该类部件所具有的共同形态特征,这些 汉字部件是构建汉字编码体系的基本字形码元: 一丨亅丿丶ㄟ乚<img file="C200510052219C0002150918QIETU.GIF" wi="57" he="76" /><img file="C200510052219C0002134459QIETU.GIF" wi="44" he="63" />横竖和竖左钩撇点捺横向上钩和斜右钩折弯钩 乛亠十乂艹卄扌丰 斜角笔形直角笔形头笔正叉斜叉草头斜插正插 亻氵冫口日口 金旁头单人旁三点水和两点水空小方框实小方框大方框 月木小忄八丷王 月字形木字形小字形八字形王字形; (3)所述汉字的字形编码元素根据笔画形态、方向以及相互关系的概念与键盘 上对应的拉丁字母、数字代码按象形、形声的关系形成自然有规律的映射关联,汉 字字形编码元素及其代码的集合与汉字字形编码规则共同构建描述汉字轮廓特征 的多元汉字编码输入方法及其编码体系,各字形编码元素与键盘上所对应的拉丁字 母和数字代码如下: a、基本字形码元的字母代码 E—一横 I—丨亅竖和竖左钩 J—丿撇 U—、点 R—ㄟ捺 C—乚<img file="C200510052219C0003150415QIETU.GIF" wi="34" he="60" />横向上钩和斜右钩S-<img file="C200510052219C0003151116QIETU.GIF" wi="34" he="62" />折弯钩A—亠头笔,点与横的组合 X—乂斜叉,两笔斜交叉 H—十正叉,两笔垂直正交叉 N—艹卄草头,草字头和草字头的变形 W—扌斜插,一笔斜向穿过两笔或两笔以上的笔画 M—丰正插,一笔垂直穿过两笔或两笔以上的笔画 T—金旁头,撇与横的组合 K—乛斜角笔形,一笔向下斜向转折或两笔笔头斜向相接组成的斜角笔形 L—直角笔形,一笔向下垂直转折或两笔笔头垂直相接组成的直角笔形 Y—亻单人旁 G—氵冫三点水、两点水 0—口空小方框,小框内无笔画 Q—日实小方框,小框内有笔画 D—口独立的大方框,大方框外无附加笔画 P—月月和月字形的变形 F—木木和木字形的变形 V—小忄小和小字形的变形 B—八丷八和八字形的变形 Z—王王和王字形的变形; b、基本字形码元的数字代码 1—一横 11—乚<img file="C200510052219C0003150447QIETU.GIF" wi="44" he="50" />横向上钩和斜右钩10—王王和王字形的变形 2—丨亅竖和竖左钩 22—丿撇 20—亻单人旁 20-<img file="C200510052219C0003150452QIETU.GIF" wi="55" he="57" />折弯钩3—丶点 33—ㄟ捺 30—氵冫三点水、两点水 4—十正叉,两笔垂直正交叉 44—乂斜叉,两笔斜交叉 40—艹卄草头,草字头和草字头的变形 5—丰正插,一笔垂直穿过两笔或两笔以上的笔画 55—扌斜插,一笔斜向穿过两笔或两笔以上的笔画 6—口空小方框,小框内无笔画 66—日实小方框,小框内有笔画 60—口独立的大方框,大方框外无附加笔画 7—直角笔形,一笔向下垂直转折或两笔笔头垂直相接组成的直角笔形 77—乛斜角笔形,一笔向下斜向转折或两笔笔头斜向相接组成的斜角笔形 70—月月和月字形的变形 8—八丷八和八字形的变形 88—金旁头,撇与横的组合 9—小忄小和小字形的变形 99—木木和木字形的变形 0—亠头笔,点与横的组合; (4)所述的汉字编码输入方法包括拉丁字母编码输入方式、数字编码输入方式 和拉丁字母数字混合编码输入方式,多种输入方式相互兼容、共同存在,无需作任 何切换便可交替使用其中一种编码方式直接输入汉字,各种编码方式的汉字编码是 不等长码,汉字的拉丁字母编码方式的最大码长为四键,汉字的数字编码方式的最 大码长为六键,汉字的字母数字混合编码方式的最大码长为五键,各种方式的汉字 编码,其码元的取码顺序分别为: a、汉字的字母编码输入方式: 首形字母码+尾形字母码+补形字母码+特征字母码; b、汉字的数字编码输入方式: 首形数码+尾形数码+补形数码+特征数码; c、汉字的混合编码输入方式: 首形字母码+尾形字母码+补形字母码+特征数码; (5)所述的汉字编码输入方法,其各种输入方式的汉字编码遵循同一个编码规 则,其特征在于: a、对汉字取形码,在既能够取单笔画又能够取多笔画字元部件时,应优先按 多笔画字元取码,这是编码时“取大部件优先”的规则; b、一个笔形或部件,前角已用过,后角仍允许重复取码; c、一个笔形或部件允许分角取码; d、一笔的上下两段与其它笔画构成两种不同的笔形或部件的,应分角取码; e、凡缺角的汉字取形码时,缺角部分无笔画的形码一律取A,这是编码时“缺 角取A”的规则,数字编码则取0; f、对于字首被头笔画(亠)、草字头(艹)或变形的草字头所覆盖的汉字,在 取其右上角的补形码时,不直接取其右上角,应除去头笔画(亠)和草字头(艹) 后再取右上角的笔画作补形码; g、对于外围是“口、门、辶”的汉字,在取其右下角的尾形码时,不直接取 其右下角,而改取其框内右下角的笔画作尾形码,但在“口、门、辶”的上、下、 左、右有附加笔画的汉字不在此类,仍同一般汉字取右下角的笔画作尾形码; h、在取汉字的特征码时,遇到正插或者斜插的笔画部件,不必将其整个部件 去掉,只需去掉该部件中的纵向笔画,然后再对余下的部分取右上角的笔形作为特 征码; i、在取汉字的特征码时,如果遇到“山、戈、页、气、宀、雨、竹、鸟、攵、 戋、刂、阝”偏旁,应直接跳过这些偏旁取汉字的特征码。
地址 530001广西壮族自治区南宁市明秀东路175号广西师范学院科技处