发明名称 汉字规范五笔字型码
摘要 本发明提出了一种能对构成汉字的笔画序列进行分段拆分的严格、统一、规范的编码方案。最大优点是:其编码字元数目不加限制,并且无须记忆。适用于任意大小的汉字字符集的编码,适合于所有会写汉字的使用者。主要编码原则为:对汉字笔画序列进行分段拆分时以字型结构间隙、27个主要字元(高频部首)和三个高频字元、及笔画相离、相连、相交、成框、成圈、同类六种笔型结构的变化为字元区分标记。
申请公布号 CN1164693A 申请公布日期 1997.11.12
申请号 CN96105637.1 申请日期 1996.05.04
申请人 李保源 发明人 李保源
分类号 G06F3/023 主分类号 G06F3/023
代理机构 代理人
主权项 一种汉字笔形编码方案,该方案以横、竖(包括竖左钩)、 撇、掭、折五种笔型(对应编号“1”、“2”、“3”、“4” 、“5”)为基础,对汉字笔形序列,按一定规则进行分段拆分, 每一段成一组,并作为一个字元,每一字元以首两笔的笔形编号 加以标记,将所有字元分为5×5=25类,编号为“11”、 “12”……“54”、“55”,据此对汉字进行编码,其特 征在于: a.对汉字笔画序列进行分段拆分、产生字元时以字型结构 的间隙,27个取作主要字元的高频部首(钅、木、氵、火、土、 日、月、艹、竹、亻、宀、虫、犭、疒、足、扌、衤、讠、纟、 口、女、阝(在左)、山、石、辶、王、忄),“小”、“人”、 “了”三字,及汉字笔画的相离、相连、相交、成框、成圈、同 类六种笔型结构的变化为汉字中字元间的区分标记;规定汉字笔 画不论属于何种笔型结构,凡连续笔画若构成主要字元和“小”、 “人”、“了”字均应拆出,相离的连续笔画作为一个字元,相 连、相交笔画序列中如具有成框、成圈、同类的笔型结构,其相 应笔画均应拆出,作为字元; b.规定16个主要字元和3个高频字元的编码如下表所示: <tables id="table1" num="001"><table width="390"><tgroup cols="5"><colspec colname="c001" colwidth="20%" /><colspec colname="c002" colwidth="20%" /><colspec colname="c003" colwidth="20%" /><colspec colname="c004" colwidth="20%" /><colspec colname="c005" colwidth="20%" /><thead><row><entry morerows="1"> 11 </entry><entry morerows="1"> 12 </entry><entry morerows="1"> 13 </entry><entry morerows="1"> 14 王 </entry><entry morerows="1"> 15 火 </entry></row></thead><tbody><row><entry morerows="1"> 21 木 </entry><entry morerows="1"> 22 艹 </entry><entry morerows="1"> 23 虫 </entry><entry morerows="1"> 24 日 </entry><entry morerows="1"> 25 </entry></row><row><entry morerows="1"> 31 </entry><entry morerows="1"> 32 </entry><entry morerows="1"> 33 月 </entry><entry morerows="1"> 34 钅 </entry><entry morerows="1"> 35 </entry></row><row><entry morerows="1"> 41 宀 </entry><entry morerows="1"> 42 土 </entry><entry morerows="1"> 43 亻入 </entry><entry morerows="1"> 44 十 </entry><entry morerows="1"> 45 疒 </entry></row><row><entry morerows="1"> 51 女 </entry><entry morerows="1"> 52 </entry><entry morerows="1"> 53 山 </entry><entry morerows="1"> 54 衤讠 </entry><entry morerows="1"> 55 </entry></row></tbody></tgroup></table></tables>规定“口”字的编码其第一位编号取“1”,其第二位编号 则为:处于左右位置关系时取“1”,处于包围位置关系时取 “5”其余情况依交、连、离及先上后下、先右后左的顺序取和 相邻笔画的笔型相同的编号; 规定横、竖、撇、掭、折五种单笔画字元的编码的第二位编 号,除交叉横笔外,依次按和相邻笔画间的关系,即相交、相连, 相离及上、下、右、左的优先顺序取相邻笔画的笔型编号,交叉 横笔的编码一律取“14”; c.将汉字划分为五大类,在通常的独体、左右、上下、包 围四类结构基础上再增加一类、第五类,由以主要字元“艹”、 “竹”、“宀”作部首的上下结构汉字,以“辶”、“疒”作部 首的包围结构汉字,及其余主字元作部首的左右结构汉字从其原 属结构类中划分出来组合而成,并相应给以编号为“1”、“2” 、“3”、“4”、“5”,并用作识别码的第二位编号。
地址 226002江苏省南通市唐闸新华三村一幢乙门502室