主权项 |
1、一种用于计算机汉字输入的编码技术,根据汉字四角号码按其编码规则对汉字进行数字编码,此编码输入计算机用以检索汉字的技术,其特征在于:用数字编码加汉字拼音辅音构成的一种编码方法,其笔形代号为:①将“0”码代表的笔划扩大为“┴、广、疒”,②将“4”码代表的笔划扩大为“十、艹”两类,属一横笔和纵笔相交叉的,③将“5”码代表的笔划限定为一笔纵穿两笔的,取码规则为①框形结构的字取内部的笔划作为下角,闭口的框形结构作字头时,应取框内右角的字形作码,类似框形结构的字取中间字形的下角作码,这类字形作为偏旁时,取内部靠外侧的笔划作为一个下角,若框内无字形,则编码取“0”,②由一横勾或一捺上托字形,依此笔划上托字形的右下角取码,③对字头或字尾只有一个码的字,用字头右下角的笔形或字尾右上的笔形取码,④以“点”为字头的字,一律编码为“30”,⑤递推或嵌套原则,即一个字形包含在另一个字形之内,⑥取码惟上惟先的原则,即笔划较少的字取码自上而下的取,先尽上面的取,但至少为下角取码留一笔,作为汉字拼音的辅音有两个声母的只取一个声母,词组的编码取码规则,①一个词组的编码是,用两个字词的字头编码,即取第一个字和第二个字的上码依次组成形码,然后再掇上最末一个字的辅音作为声码,②多个词组的编码,首先按语义将词组分成几个字节,然后取前两个字节中的第一个字编成数字码,再将最后一个字节的最末一个字的辅音作为声码,即组成词组的编码,③取码惟上惟上的原则。 |