发明名称 组合式双笔类主副码汉字、词语编码输入法及其键盘
摘要 组合式双笔类主副码汉字、词语编码输入方法,根据GF3001规范规定选取687个编码部件,归并成409个编码部件组,确定了31个高频编码部件,主要根据主形编码部件的读音或叫法名称的拼音首字母作为其字母型主码,其第1、2个笔画组合赋于一个字母为副码1,第3、第4个笔画名称的拼音首字母相应作为其字母型副码2、副码3,笔画不足的用字母V来表达,形成字母型编码资源,运用这些编码资源形成了字母型,拼音首字母、非拼音首字母的汉字、词语的编码输入法,组合应用,既能输入读得出音的字,又能输入读不出音的字,在对GB18030字库与三级词语库的编码输入时,其重码数大多不超过10个,应用效果良好。
申请公布号 CN104133560A 申请公布日期 2014.11.05
申请号 CN201410342558.8 申请日期 2014.07.17
申请人 黄振荣 发明人 黄振荣
分类号 G06F3/023(2006.01)I 主分类号 G06F3/023(2006.01)I
代理机构 无锡市大为专利商标事务所(普通合伙) 32104 代理人 朱建均
主权项 组合式双笔类主副码汉字、词语编码输入法,利用计算机或者手机通用软、硬字母键盘输入汉字、词语,其特征在于: 一、选定编码部件 根据国家语委GF3001——1997《信息处理用GB13000.1字符集汉字部件规范》的要求,拆分汉字,确定参与编码的编码部件; 选用GF3001——1997《信息处理用GB13000.1字符集汉字部件规范》的560个基础部件,选用GB0011——2009《汉字部首表》的201个主部首和100个附形部首,再选用含有560个基础部件中的若干非成字基础部件的汉字及汉字构件:卑、北、匆、曹、春、单、段、发、贯、亀、龜、庚、亥、壺、華、亦、<img file="dest_path_FDA0000561954260000012.GIF" wi="92" he="72" />与、<img file="dest_path_FDA0000561954260000013.GIF" wi="88" he="60" />堇、兼、可、婁、免、卯、南、囊、农、<img file="dest_path_FDA0000561954260000015.GIF" wi="127" he="68" />棄、牽、其、妻、前、乌、烏、勿、网、行、叚、羲、<img file="dest_path_FDA0000561954260000014.GIF" wi="117" he="71" />以、制,共计44个,为了便于记忆使常用的数字类汉字与字符都定为编码部件又选用了:一、百、六、○,扣除重复计算数,总计选用了687个部件作为本汉字编码法采用的基本编码单元,称之为编码部件,并依照编码部件的构字理据相同、或写法稍异、或有所省减、或置向不同的变体、或互为繁、简字等关联性,归并成409个编码部件组,组内的第一个编码部件称为主形编码部件,在不违反GF3001规范的前提下,在这687个编码部件基础上允许增、减百分之二十的编码部件选用量,只对重码率略有影响,但不改变该编码输入法的实质;二、确定高频编码部件及其主部位位置以及高频编码部件的字母型主码确定了31个构字能力特别强的部首为高频编码部件,在本发明确定的687个编码部件中除去31个高频编码部件其余的编码部件称之为普通编码部件; 在同一字母键位上只设置一个或一组互为繁、简字体的高频编码部件,同时还确定了其主部位的位置,主部位位置就是该高频编码部件在构成汉字中通常所处的位置,其中高频编码部件:山、扌、、纟、糹、月、<img file="dest_path_FDA0000561954260000016.GIF" wi="118" he="72" />亻、木、艹、訁、讠等9个编码部件组的12个高频编码部件不是以它们的读音或部首名称的汉语拼音的首字母作为它们的主码,而是人为指定;确定的31个高频编码部件的形状、字母型主码、主部位位置如表一所示:表一:<img file="dest_path_FDA0000561954260000011.GIF" wi="2024" he="853" /><img file="dest_path_FDA0000561954260000021.GIF" wi="2078" he="935" />上述31个高频编码部件以及字母型主码的设定,其数量与字母型主码的设定可以在不超出百分之四十的范围内变动,只对重码率有影响,但不改变编码方法的实质; 三、确定每个编码部件的双笔类主码、副码1、副码2、副码3,形成汉字编码方法的双笔类编码资源 选定的687个编码部件归并成409个编码部件组,其组内的第一个编码部件称之为主形编码部件,组内的其他编码部件的主码都与主形编码部件的主码一样,主形编码部件都有一定的读音或叫法,除高频编码部件的主码已确定了以外,其他主形编码部件的主码一般都取其读音或叫法名称的拼音首个字母作为双笔类的字母型主码;为了降低重码率,采用点折I法:主形编码部件的读音的拼音首个字母为Y的,而且主形编码部件的首笔是点(丶)、折(乛)的取I作为其字母型主码,首笔为横(一)、竖(丨)、撇(丿)的取Y作为其字母型主码;除此之外其他的普通编码部件的主形编码部件的主码仍取其读音或叫法的拼音首个字母作为双笔类的字母型主码; 双笔类字母型副码1的取码方法:根据国家规范,汉字由横(一)、竖(丨)、撇(丿)、点(丶)折(乛)五种笔画组成,本发明依次用这五种笔画读音的汉语拼音的首个字母H、S、P、D、Z来表示每个单个笔画,单个笔画的编码部件,就把它作为该编码部件的字母型副码1;对于由两个以上笔画组成的编码部件,依次取其第一、第二个笔画的组合赋于一个字母,作为该编码部件的字母型副码1,安排在计算机的字母键盘上,笔画组合所对应的字母,具体如下所示: <tables num="0001" id="ctbl0001"><table><tgroup cols="8"><colspec colname="c001" colwidth="12%" /><colspec colname="c002" colwidth="12%" /><colspec colname="c003" colwidth="12%" /><colspec colname="c004" colwidth="12%" /><colspec colname="c005" colwidth="12%" /><colspec colname="c006" colwidth="12%" /><colspec colname="c007" colwidth="12%" /><colspec colname="c008" colwidth="12%" /><tbody><row><entry morerows="1">笔画组合 </entry><entry morerows="1">一乛 </entry><entry morerows="1">乛一 </entry><entry morerows="1">乛丿 </entry><entry morerows="1">一丿 </entry><entry morerows="1">丿丿 </entry><entry morerows="1">一丨 </entry><entry morerows="1">一一 </entry></row><row><entry morerows="1">对应字母 </entry><entry morerows="1">A </entry><entry morerows="1">B </entry><entry morerows="1">C </entry><entry morerows="1">D </entry><entry morerows="1">E </entry><entry morerows="1">F </entry><entry morerows="1">G </entry></row><row><entry morerows="1">笔画组合 </entry><entry morerows="1">丨一 </entry><entry morerows="1">丶丿 </entry><entry morerows="1">丨丨 </entry><entry morerows="1">丨丿 </entry><entry morerows="1">丨丶 </entry><entry morerows="1">丨乛 </entry><entry morerows="1">  </entry></row><row><entry morerows="1">对应字母 </entry><entry morerows="1">H </entry><entry morerows="1">I </entry><entry morerows="1">J </entry><entry morerows="1">K </entry><entry morerows="1">L </entry><entry morerows="1">M </entry><entry morerows="1">  </entry></row><row><entry morerows="1">笔画组合 </entry><entry morerows="1">丶丶 </entry><entry morerows="1">丶乛 </entry><entry morerows="1">丿乛 </entry><entry morerows="1">丿丨 </entry><entry morerows="1">一丶 </entry><entry morerows="1">丿一 </entry><entry morerows="1">丶丨 </entry></row><row><entry morerows="1">对应字母 </entry><entry morerows="1">O </entry><entry morerows="1">P </entry><entry morerows="1">Q </entry><entry morerows="1">R </entry><entry morerows="1">S </entry><entry morerows="1">T </entry><entry morerows="1">U </entry></row><row><entry morerows="1">笔画组合 </entry><entry morerows="1">乛丨 </entry><entry morerows="1">丿丶 </entry><entry morerows="1">乛丶 </entry><entry morerows="1">丶一 </entry><entry morerows="1">乛乛 </entry><entry morerows="1">  </entry><entry morerows="1">  </entry></row><row><entry morerows="1">对应字母 </entry><entry morerows="1">V </entry><entry morerows="1">W </entry><entry morerows="1">X </entry><entry morerows="1">Y </entry><entry morerows="1">Z </entry><entry morerows="1">  </entry><entry morerows="1">  </entry></row></tbody></tgroup></table></tables>双笔类字母型副码2、副码3的取码方法:对于由4个或4个以上笔画组成的编码部件依次取第3笔画、第4笔画的笔画的字母型码作为编码部件的字母型副码2、副码3;对于不足4个笔画构成的编码部件,缺失的笔画,都取字母V;根据上述方法确定本发明的409个编码部件组的687个编码部件的字母型主码、副码1、副码2、副码3,依次排列,对于不足4个笔画构成的编码部件,缺失的笔画,确定都采用字母V补足的方案;主形编码部件的读音的拼音首个字母为Y的,采用点折I法;表中双笔类主副码,为了看得醒目采用了大写字母,它与小写字母等效,在实际编码时,编码表采用小写字母;具体如下表所示:<img file="dest_path_FDA0000561954260000041.GIF" wi="2085" he="3033" /><img file="dest_path_FDA0000561954260000051.GIF" wi="2085" he="3035" /><img file="dest_path_FDA0000561954260000061.GIF" wi="2085" he="3035" /><img file="dest_path_FDA0000561954260000071.GIF" wi="2085" he="3035" /><img file="dest_path_FDA0000561954260000081.GIF" wi="2085" he="3006" /><img file="dest_path_FDA0000561954260000091.GIF" wi="2085" he="3035" /><img file="dest_path_FDA0000561954260000101.GIF" wi="2085" he="3035" /><img file="dest_path_FDA0000561954260000111.GIF" wi="2085" he="1368" />组合式双笔类主副码字母型汉字、词语编码输入法,利用双笔类字母型编码资源,形成组合式双笔类主副码字母型汉字、词语编码输入法,包含有:①双笔类拼音首字母主副码字母型汉字编码方法;②双笔类拼音首字母主副码字母型词语编码方法;③双笔类非拼音首字母主副码字母型汉字编码方法;④双笔类非拼音首字母主副码词语编码方法;针对常用汉字、常用词语和GB18030的27000多汉字字符集等的大字符集的汉字的编码输入,进行组合编码输入操作:对常用汉字、词语采用拼音首字母字母型汉字、词语编码输入法,对于GB18030的27000多汉字采用非拼音首字母主副码字母型汉字编码方法,取得编码;双笔类拼音首字母字母型汉字、词语编码与双笔类非拼音首字母字母型汉字编码,组合在同一张码表; 双笔类字母型汉字、词语的编码方法如下: 在以下的叙述中,规定:对一个编码部件取1码,即取其字母型主码,取2码,即依次取其字母型主码、副码1,取3码,即依次取其字母型主码、副码1、副码2;取4码,即依次取其字母型主码、副码1、副码2、副码3; (一)双笔类拼音首字母主副码字母型汉字编码方法 A、码长不定,最大码长设定为4;确定采用双笔类字母型编码资源; B、单个编码部件的汉字的编码:如果该汉字的拼音首字母与该编码部件的字母型主码相同:对于是高频编码部件的,则依次取该编码部件的字母型主码、副码1;对于是普通编码部件的,采用二码法,依次取该编码部件的字母型主码、副码1;如果该汉字的拼音首字母与该编码部件的字母型主码不相同的,又是高频编码部件的,采用二码法,则依次取该字的拼音首字母、该高频编码部件的字母型主码;如果该汉字的拼音首字母与该编码部件的字母型主码不相同的, 又是普通编码部件的,而且字母型主码不是i的,采用二码法,依次取该汉字的拼音首字母、该编码部件的字母型主码;如果该汉字的拼音首字母为y而编码部件的字母型主码为i的,采用三码法,则依次取该汉字的拼音首字母、该编码部件的字母型主码、副码1; C、2个或2个以上编码部件组成的汉字,汉字可以分成首部与余部两部分; D、对于由2个或2个以上的编码部件组成的汉字,分如下二个部分依次确定其字母型编码: 第1部分,取根据汉字的汉语拼音的首字母作为第1部分的字母型编码; 第2部分,以下述方法取汉字的首部和余部的编码: 对于由2个的编码部件组成的汉字字母型编码方法:如果首部是一个处于主部位的高频编码部件的,采用三码法,则依次对首部那个编码部件取1码,对余部那个编码部件取2码;如果首部件编码部件是普通编码部件的,采用一二法,则依次对首部那个编码部件取1码,对余部那个编码部件取2码; 对于由3个或3个以上的编码部件组成的汉字:如果是单首部汉字,不管第1个编码部件是高频编码部件还是普通编码部件,则依次取第1、第2、第末个编码部件各1码;如果其首部为组合首部的汉字,则该组合首部取2码,采用首末法,依次对组合首部的第1、第末个编码部件各取1码,其余部为单个编码部件,取1码; 把上述第1、第2二个部分取的字母型编码,依次组合成整个汉字的编码; E、编码时,采用英文小写字母; (二)双笔类非拼音首字母主副码字母型汉字编码方法 A、码长不定,最大码长设定为4,采用双笔类字母型编码资源; B、单个编码部件的汉字:如果该编码部件是高频编码部件的,则依次取其字母型主码、字母型副码1;如果是普通编码部件的:采用二码法,则依次取其字母型主码、副码1; C、由2个或2个以上编码部件组成的汉字:可以分成首部与余部两部分; D、对于由2个的编码部件组成的汉字字母型编码方法:如果首部是一个处于主部位的高频编码部件的,采用三码法,则依次对首部那个编码部件取1码,对余部那个编码部件取2码;如果首部件编码部件是普通编码部件的,采用二二法,则依次对首部那个编码部件取2码,对余部那个编码部件取2码; E、对于由3个编码部件组成的汉字:,如果首部是一个单首部,又是一个处于主部位的高频编码部件的,采用末二法,则依次对首部的那个高频编码部件取1码、余码的第1编码部件取1码、余部的第2编码部件取2码;如果首部是一个单首部,又是一个普通编码部件的,采用首二法,则依次对首部的那个编码部件取2码,余部的第1、第2编码部件各取1码;如果首部是组合首部,则依次对组合首部的第1、第2个编码部件各取1码,余部的那个编码部件取2码; F、对于由4个或4个以上的编码部件组成的汉字:如果首部是个单首部的,又是处于主部位的高频编码部件的,则依次取首部的那个编码部件1码、余部的第1、第2、第末个编码部件各1码;如果首部是一个单首部,又是一个普通编码部件的,采用首二法,则依次对汉字的首部那个编码部件取2码、余部的第1、 第末个编码部件各取1码;如果首部是组合首部,对于组合首部取码方案,采用组合首部首、次、末取码法,即依次对组合首部的第1、第2、第末个编码部件各取1码,汉字的余部那个部件取1码; 把上述汉字各编码部件取的编码,以编码部件在汉字组成中的先后为序,依次组成整个汉字的编码; E、编码时,采用英文小写字母; (三)双笔类拼音首字母主副码字母型汉语词语编码方法 A、采用双笔类字母型编码资源,依据双笔类拼音首字母汉字编码方法取得的汉字编码,取词语的编码;词语编码的最长码长设定为6; B、对于由2个汉字组成的词语,采用二二法,依次对第1个汉字、第2个汉字各取2码; C、对于由3个汉字组成的词语,采用一一二法,则依次取第1个汉字1码、第2个汉字1码、第3个汉字2码; D、对于由4个汉字组成的词语,采用四码法,则依次取第1、第2、第3、第4个汉字的各取1码; E、对于由5个汉字组成的词语,采用五码法,则依次取第1、第2、第3、第4、第5个汉字各1码; F、对于由6个或6个以上汉字组成的词语,顺六法,依次取词语的第1、第2、第3、第4、第5、第6个汉字各1码; G、编码时,采用英文小写字母;、 (四)双笔类非拼音首字母主副码字母型汉语词语编码方法 利用确定的双笔类非拼音首字母主副码字母型汉字编码输入法对每个汉字的编码,实施对汉语词语的非拼音首字母编码;词语编码的最长码长设定为6;对一个汉字取2码:如果是由二个或二个以上编码部件组成的汉字,采用首次法,即依次取该汉字的第1、第2个编码部件的字母型主码; A、对于由2个汉字组成的词语编码,采用二二法,即依次取该词语的第1个汉字2码、第2个汉字2码; B、对于由3个汉字组成的词语编码:采用末二法,即依次取该词语的第1、第2个汉字各1码、第3个汉字2码; C、对于由4个汉字组成的词语编码,采用四码法,即依次取该词语的第1、第2、第3、第4个汉字各1码; D、对于由5个汉字组成的词语编码,依次取该词语的第1、第2、第3、第4、第5个汉字各1码; E、对于由6个或6个以上汉字组成的词语编码,采用顺六法,依次取该词语的第1、第2、第3、第4、第5、第6个汉字各取1码; G、编码时,采用英文小写字母。 
地址 214174 江苏省无锡市惠山区堰桥街道堰玉路4号