发明名称 部首输入法
摘要 输入法候选字词窗口,分为主候选栏和辅候选栏;主候选栏用于显示编码包含辅码的候选字和主码编码的候选字词;辅候选栏用于显示编码包含辅码的候选字和编码为汉语拼音全拼编码的候选字词。1、2、3、4、5五个数字键定义为主候选字词选择键,用于选择主候选栏中的候选字词;7、8、9、0四个数字键定义为辅候选字词选择键,用于选择辅候选栏中的候选字词。当编码包含辅码的辅码候选字的编码位频率,小于主候选栏中编码位频率最高的候选词的编码位频率时,将该候选字显示于辅候选栏中。
申请公布号 CN101872250A 申请公布日期 2010.10.27
申请号 CN200910136002.2 申请日期 2009.04.23
申请人 王雅弟 发明人 王雅弟
分类号 G06F3/023(2006.01)I 主分类号 G06F3/023(2006.01)I
代理机构 代理人
主权项 1.一种计算机汉字输入法,其特征在于:(a)将2009年5月1日实施的《汉字部首表》中规定的201个主部首、99个附形部首做为对汉字字形编码的最大编码码元集合;将300个字形编码码元,按其首笔画及笔画数分成26组,具体为:一起笔一画、一起笔二画、一起笔三画、一起笔四画、一起笔五画及五画以上、丨起笔一画、丨起笔二画、丨起笔三画、丨起笔四画、丨起笔五画及五画以上、丿起笔一画、丿起笔二画、丿起笔三画、丿起笔四画、丿起笔五画、丿起笔六画及六画以上、丶起笔一画、丶起笔二画、丶起笔三画、丶起笔四画、丶起笔五画及五画以上、乛起笔一画、乛起笔二画、乛起笔三画、乛起笔四画、乛起笔五画及五画以上;将26组字形编码码元指定到计算机通用键盘的26个字母键上,具体为:h:一;j:十、厂、匚;k:干、工、土、士、扌、艹、寸、廾、大、兀、尢、弋;l:王、无、韦、耂、<img file="F2009101360022C0000011.GIF" wi="81" he="50" />木、朩、支、犬、歹、车、牙、戈、旡、比、瓦;n:玉、示、甘、石、龙、耒、<img file="F2009101360022C0000012.GIF" wi="79" he="55" />老、耳、臣、襾、<img file="F2009101360022C0000013.GIF" wi="79" he="54" />覀、西、而、页、至、麦、镸、走、赤、車、豆、酉、辰、豕、青、長、<img file="F2009101360022C0000014.GIF" wi="80" he="56" />雨、革、頁、面、髟、馬、鬲、黄、麥、鼓;g:丨、亅;f:<img file="F2009101360022C0000015.GIF" wi="75" he="68" />刂、卜、冂;d:小、、口、囗、山、巾;s:止、攴、、<img file="F2009101360022C0000016.GIF" wi="82" he="47" />曰、日、<img file="F2009101360022C0000017.GIF" wi="75" he="40" />贝、水、见;a:歺、业、氺、目、田、罒、皿、虍、虫、肉、卤、貝、見、里、、足、邑、非、齿、虎、門、黾、韭、骨、鬥、<img file="F2009101360022C0000018.GIF" wi="76" he="55" />鹵、鼎、黑、黽、齒;y:丿;u:亻、、八、人、入、、<img file="F2009101360022C0000019.GIF" wi="83" he="63" />勹、<img file="F2009101360022C00000110.GIF" wi="83" he="62" />儿、匕、几;i:彳、彡、犭、夕、夂、饣;o:牛、手、、气、毛、攵、长、片、斤、爪、父、尣、爫、月、氏、欠、风、殳;p:钅、生、矢、禾、白、瓜、鸟;m:缶、舌、竹、、臼、自、血、舟、色、<img file="F2009101360022C00000111.GIF" wi="94" he="65" />身、辵、采、谷、豸、龟、角、隹、阜、金、飠、鱼、香、鬼、食、風、鳥、魚、黍、鼠、鼻、龜、龠;t:丶;r:亠、冫、丷、冖、讠;e:丬、广、门、氵、忄、宀、辶;w:文、方、火、斗、灬、户、礻、心;q:疒、立、穴、衤、齐、衣、衤、羊、、、米、言、辛、音、首、高、麻、鹿、齊、龍;b:乛(所有折笔);v:凵、卩、阝(在左、在右)、刀、力、又、厶、廴、;c:彐、<img file="F2009101360022C0000021.GIF" wi="82" he="46" />尸、己、已、巳、弓、子、中、<img file="F2009101360022C0000022.GIF" wi="78" he="62" />女、飞、马、彑、<img file="F2009101360022C0000023.GIF" wi="79" he="52" />纟、幺、巛;x:肀、爿、毋;z:、、疋、皮、癶、矛、母、聿、<img file="F2009101360022C0000024.GIF" wi="84" he="50" />艮、艸、羽、糸、糹、隶、韋、飛;依笔顺,使用最大编码码元集合中的部首将字符集内所有汉字拆分;(b)选取2009年5月1日实施的《汉字部首表》中150个常用部首做为对汉字字形编码的最小编码码元集合;将150个字形编码码元,按其首笔画及笔画数分成24组,指定到计算机通用键盘的24个字母键上,具体为:h:一;j:十、厂、匚;k:工、土、士、扌、艹、寸、廾、大、尢、弋;l:王、耂、<img file="F2009101360022C0000025.GIF" wi="78" he="50" />木、犬、歹、车、牙、戈、瓦;n:石、龙、耳、覀、页、走、車、酉、豕、雨、革、頁、馬;g:丨;f:<img file="F2009101360022C0000026.GIF" wi="59" he="52" />刂、卜、冂;d:小、、口、囗、山、巾;s:止、曰、日、贝、水、见;a:目、田、罒、皿、虍、虫、貝、見、、門、鬥、<img file="F2009101360022C0000027.GIF" wi="76" he="54" />黑;y:丿;u:亻、八、人、、勹、儿、匕、几;i:彳、彡、犭、夕、夂、饣;o:牛、气、攵、斤、爪、父、爫、月;p:钅、禾、白、瓜、鸟;m:、臼、自、舟、身、豸、飠、鱼、鳥、魚、鼠;t:丶;r:亠、冫、丷、冖、讠;e:丬、广、门、氵、忄、宀、辶;w:文、方、火、灬、户、礻、心;q:疒、立、穴、衤、衣、衤、羊、米、龍;b:乛;v:凵、卩、阝、刀、力、又、厶、廴;c:彐、尸、弓、子、女、马、纟、巛;将属于最大编码码元集合并且不属于最小编码码元集合的部首,使用最大编码码元集合中的部首对其进行拆分;(c)将以上所述部首做为对汉字字形编码的编码码元;依笔顺取其字形的第一、第二、最末一个编码码元的代码进行编码;当汉字的字形由两个编码码元组成时,依笔顺依次取其字形的第一、第二个编码码元的代码进行编码;当汉字的字形由一个编码码元组成时,取这个编码码元的代码进行编码;分别用最大编码码元集合、最小编码码元集合,以及每一个包含于最大编码码元集合并且包含最小编码码元集合的部首集合对汉字字形进行拆分取码,做为汉字的字形编码;其中集合包含关系是指真子集的集合包含关系;通过以下步骤,实现幂编码码元集合对汉字字形幂拆分编码;通过计算机辅助设计,依次为每一个汉字调用过程A,进行自动幂编码;过程A:{将汉字字形第一个编码码元的代码存入递归变量a,调用过程B;如果汉字字形的第一个编码码元不是最小编码码元集合中的部首,将汉字字形的第二个和第三个编码码元恢复成原来的第二个和第三个编码码元,并且将汉字字形的第一个编码码元拆分,递归调用过程A;}过程B:{将汉字字形第二个编码码元的代码存入递归变量b,调用过程C;如果汉字字形的第二个编码码元不是最小编码码元集合中的部首,将汉字字形的第三个编码码元恢复成原来的第三个编码码元,并且将汉字字形的第二个编码码元拆分,递归调用过程B;}过程C:{将汉字字形最后一个编码码元的代码存入递归变量c,保存递归变量a、b、c中的编码结果;如果汉字字形的最后一个编码码元不是最小编码码元集合中的部首,将汉字字形的最后一个编码码元拆分,递归调用过程C;}删除重复的编码结果,将所有不重复的编码结果做为汉字的字形编码;(d)当汉字字形由三个编码码元编码组成时,将这三个编码码元的代码做为该字的主码,将该字的汉语拼音做为该字的辅码;当汉字字形由两个编码码元组成时,在这两个编码码元的代码之后加上该字汉语拼音的第一个字母做为该字的主码,将该字汉语拼音的其余字母做为该字的辅码;当汉字字形由一个编码码元组成时,在这个编码码元的代码之后加上该字汉语拼音的第一个及第二个字母做为该字的主码,将该字汉语拼音的其余字母做为该字的辅码;将汉字的辅码连接在主码之后,做为该字的单字全码;词组编码依次取构成词组所有单字的单字主码,做为词组编码;在汉字编码数据库中为单字编码的每一个输入编码记录使用频率;在汉字编码数据库中为词组编码的每一个输入编码记录使用频率;每一个输入编码的使用频率定义为编码位频率;(e)输入法候选字词窗口,分为主候选栏和辅候选栏;主候选栏用于显示编码包含辅码的候选字和主码编码的候选字词;辅候选栏用于显示编码包含辅码的候选字和编码为汉语拼音全拼编码的候选字词;1、2、3、4、5五个数字键定义为主候选字词选择键,用于选择主候选栏中的候选字词;7、8、9、0四个数字键定义为辅候选字词选择键,用于选择辅候选栏中的候选字词;(f)当编码包含辅码的辅码候选字的编码位频率,小于主候选栏中编码位频率最高的候选词的编码位频率时,将该候选字显示于辅候选栏中。
地址 300250 天津市河北区革新道颂光里2-8-105室