发明名称 采用<<拼音中文系统的方法和设备去处理中文资料、文字、信息或数据
摘要
申请公布号 TW084654 申请公布日期 1987.02.01
申请号 TW075102693 申请日期 1986.06.14
申请人 叶漳民 发明人 叶漳民
分类号 G06F3/23;G06F15/40 主分类号 G06F3/23
代理机构 代理人 蔡坤财 台北巿松江路一四八号十二楼之三
主权项 1.一个为汉字而设计的图形式代码及其 存储方法,也包括汉字库和更基 本的拼音中文字母 (1)选择一套汉字去为其设计点阵绘 图汉字,简称点绘汉字的图 形式代码及其存储和操作。这全部 都可属于汉字库程序; (2)在一定精密度的规定下(拼音中文 现时采用两种不同点阵式精密度, 一个是15X18另一个是24X24,但 并不限于所选的精密度),为每个 所选汉字设计出点绘汉字; (3)选择一套 拼音中文字母 P之子{PCA},从中 可以拼出 P 拼 音 字 子{PCW},它可以准确的代表 所选每一个汉字的声、韵 和调所组成的音调节 {TS-Tone-syllable}; (4)为每一个拼音中文字母选择唯 一二进制代码, 中 文 标 准 字 符 交 换 {CSCII-Chinese Stan- 码 dard Code for Information Interchange}(第十三图); (5)建立并存储单音调节 汉 字 库 ,其中确定 拼 音 字 与 [ ]{ 汉 字 PCW-Ideogram}达到唯一性的 转换。即拼音字与点绘汉字 一一对应,全部由汉字库程序 操作。2.一个方法与第一请求权相关,拼音 中文字母代表汉语的声、韵、调、 之音调素: (1)设有15个韵母,代表16个不同的韵 母音质; (2)韵母有直接区别汉语声调的功能; (3)设有21个声母,代表汉语的21个声 母音质。3.一个方法与第二请求权相关,韵母包 括下列两种韵母: (1)设有15个韵母系,每个韵母系都有 区别声调的功能; (2)设有3个半声母也称半韵母 或介母,但没有区别声调的功 能。4.一个方法与第三请求权相关,韵母有 区别四个声调的功能,称为定调韵 母,简称韵调或调母。5.一个方法与第 四请求权相关,每个韵 母系是从一个基本韵母(代表第一声 )添加一笔,系统化的变形去代表四 个不同的声调。所以声调是永远附属 在韵母上的。6.一个方法与第二请求权相关,声母 可 分为下列三类 (1)设有短声母组,每个字母代表 一个声母发音; (2)设有长声母组,每个字母代表 一个声母发音; (3)设有一个无音质的零声母7.一个方法与第 二请求权相关,拼音中 文字母可以按汉语拼音定调的方 法去组成 子 拼 音 字 {PCW=Phonetic ChineseWord },拼音字与 音 调 节 {TS-Tonesyllable}的 关系如下: = + (PCW =TS+Q); (1)拼音字可具下列四个形式之一 [ ::污, ,于];{ TS::CV,CSV,SV,V}, = {C=Consonant}, 声 母 于= {V=Vowel}, = 韵 母 {S=Semi-consonant 半 声 母 }; = 。 零 声 母 (2) = {Q=Gen- 扩 意 义 标 eralized tone-syllable modif- ier},是用来区别同调字的。8.一个方法与第七 请求权相关,其中 可以是 或是 ,即[ :: , ] ,{Q:: , }如下 (1)[ ]表示是无意标{null set} (2)[ ]= {G= 定 字 义 标 Generalized semantic classif- icr},是加在音调节之后的 一个拼音中文字母,不具发音的功 能,只是用来区别同调字。9.一个方法与第八 请求权相关,其中的 定字义标 {G},除了字母# 79[ ]不用以外,其它拼音中文任 何一个字母都可以加在音调节之 后,作为无音质的定字义标以分 辨同调字。10.一个方法与第三请求权相关,汉 语音 素『衣』是一个最复杂的音素,同音 同调字最多,基本上是充任声、介、 韵、三种不同功能。在拼音中文系统 中,根据它不同的功能而采用三种不 同的字母组去代表『衣』 (1)声母功能(韵母发音)用:[ ] ,如[ ],又如[ 、 、 、 ],(定调哑母[ 、 、 、 ]); (2)分母用:[ ],如[ 、 、 、 ]; (3)定调韵母用:[ 、 、 、 ] ,如[ 、 、 、 ]; (4)在短声母后分辨同调字用 :[ 、 、 、 ]。11.一个方法与第十请求权相关,汉 语音 素『 』和『迂』也是复杂音素,基 本上充任声、介、韵、三种不同功能 。拼音中文,根据它们不同的功能而 各采用两种不同的字母组去代表『 』和『迂』 (1)[ 』声母功能(韵母发音)用: [山],[ 、 、 、 ],又 如[ 、 、 、 ],(定调哑 母[ 、 、 、 ]); (2)『 』介母用:[山],如[ 、 、 、 ]; (3)『 』定调韵母用:[ 、 、 、 ],如[ 、、 、 ]。 (4)『迂』声母功能(韵母发音,用: [于],[ 、 、 、 ],又 如[ 、 、 、 ],(定调哑 母[ 、 、 、 ]); (5)『迂』介母用:[于],如[ 、 、 、 ]; (6)『迂』定调韵母用:[ 、 、 、 ],如[ 、 、 、 ]。12.一个方法与第十和第十一 请求有关, 如是『衣 江』三个纯韵母音调节(发 音和收音),拼音字可以分辨 255个同调字(相当于1,020同 音字,;如是含『衣 迂』音调节( 发音或收音),拼音字可以分辨 170个同调字(相当于680个同 音字);其它的音调节(不含『衣 迂』),拼音字最少的分辨度是 85个同调字(相当于340个同音 字)。13.一个方法与第六请求权相关,一组四 个走调韵母各代一个声调,[# 27-30 、 、 、 、]。当在一个短 声母之后,其音质是『衣』{i} 。当在一个长声母之后,没有音 质只具定调功能。14.一个方法与第十三请求权相 关,定 调韵母[#35-38 、 、 、 ]其 音质是〞e〞;但如在声母「 、 、 、 , 、 、 ]{b,p,m, f;i,u, }之后其音质即为〞 o〞。15.一个方法与第十四请求权相关,定 调韵母[#79-82 、 、 、 ]如不在任何声母之后(零声母除外 ),音质为『儿』{er}的四个声 调。当其在短声母之后其音质是 『衣』{i}(第十请求权)。16.一个方法与第九请求 权相关,选择最 常用和次常用的8,000+汉字作为 主集。17.一个方法与第十六请求权相关,采用 主要词根分形的原则去分辨每个 音调节中最高出现频率的三个 同调字,称为:正体(拼音字=音 调节,[ = + ]{PCW= TS+ }),叠韵(拼音字=音调 节+相同的字调韵母,[ = + ]{PCW=TS+ ),零声 母式(拼音字=音调节+零声母,[ = + ]{PCW=TS+Z })。采用主要词根分形原则约 使3,900拼音字与主集汉字 达到一一对应,其累积率约为97%。18.一个方法与第 十七请求权相关,在 主要词根以外的拼音字都是在 音调节后加一个无音质的义标 与汉字达到唯一性的对应: = + {PCW=TS+G}, [ 任何字母除了 , , 之外](G {任何字母除了,Z,er(第 一声)之外)。19.一个方法与第十八请求权相关, 义 标是在拼音字的最后,所以也称 字尾。在主集汉字8,000字剩 余的4,100字中绝大多数(80%以上 )拼音字的字尾与汉字的部首 是相同、相似或是相关,使拼音 字与相对应的汉字之间得到高 智能的转换与联系。20.一个方法与第一请求权相 关,最长的 拼音字不超过四个字母。21.一个方法与第二 十请求权相关,拼 音字的频率加权平均长度是2.4个 字母。22.一个拼音中文字母在键盘上安排 的方法,包括安排15个韵母系,每个 韵母系有四个声调,总共为60个定 调韵母。这个安排法包括 (1)至少有四排字键,从上往下定为: 顶排,上排,中排(Home rom) ,和下排; (2)确定各声调(1,2,3或4)的 累积频率; (3)将最高累积频率的声调(第四声) 定在中排。23.一个安排键盘方法与第二十二 请求权 相关,继续按声调累积频率去确定键 盘的安排 (1)第二高累积频率的声调定在上排 ; (2)第三高累积频率的声调定在下排 。 (3)第四高累积频率的声调定在顶排 。24.一个安排键盘方法与第二十二请求权 相关,直列安排 (1)由顶、上、中、下四排用同一 手指去按键的定为直列; (2)每一个韵调母系,也称韵调 组包括四个声调,各安排在一个 直列上。25.一个安排键盘方法与第二十四请 求权 相关,声母安排 (1)确定六个声母小组的累积频率,确 定[ 、 、 、 ]半声母小组累积 频率,以上七小组(第二图,通称 声母组。确定各韵母组累 积频率; (2)六个声母组(包括半声母小组)安 排在右手下档,直列; (3)五个频率最高韵母组安排在左 手下档,直列。26.一个安排键盘方法与第二十五请 求权 相关,频率最高半声母小组[ 、 、 、 ]安排在右手食指下档,直列, 最高频率字母[#83 ]正是该列与 中排的交点。该判之左方一列,也是 用右手食指控制的,是[ 、 、 、"," ]也是高频率的声母组。定调哑母 也就是『儿』韵母系[ 、 、 、 ]是频率最高的韵母组,它们是安排 在左手食指下档,直列。频率最高的 字调母[#82 ]正是该列与中排的 交点。该列之右方一列,也是用左手 食指控制的,是[ 、 、 、 ]也是 一个高频率韵母组。27.一个安排链盘方法与第二 十六请求权 相关,按字母出现频率的高低分别安 排为左、右手的中指、无名指、和小 指去分别操作。此项字母组比上项字 母组出现频率低。28.一个方法与第二十六请求权 相关,其 中每个字键有上、下档之分。这个方 法是将出现频率高的声母、半声母、 和韵调母安排在不需要换档的下档 。29.一个方法在键盘上安排拼音中文字母 系统;此系统字母包括多组走调韵母 ,每组走调韵母有四个字母代表汉语 的四声,又包括多组声母和半声母; 这个方法包括 (1)键盘上划分出区域,在一区域中的 字键全部是用一个手去操作的; (2)确定声母、半声母、和韵调母中各 小组的相对频率; (3)所有的声母和半声都安排在右手边 ; (4)高频率的韵调母安排在左手边。30.一个为计算 机或打字机输入拼音中文 字母用的键盘;该字母有多个声母、 半声母、和韵调组,每组的四个定调 韵母代表汉语的四声;键盘包括 (1)多个字键;这些字键分别安排在左 右两区,这两区又分别用左右手去 操作; (2)键盘的一个区域是适应高频率韵调 母输入; (3)键盘的另一个区域是适应高频率声 母和半声母输入。31.一个键盘与第三十请求权相 关,其中 (1)该键盘上的字键横分为四排,即由 上至下一个顶排,一个上排 ,一个中排,一个下排 ; (2)此中排字键适用于最高频率韵 调母的声调组(第四声)。32.一个键盘与第三 十一请求权相关,其 中 (1)该键盘上的字键可按直排分为多列 ,每一列由同一个手指去控制; (2)至少有一列这样的字键用来输入同 一个韵母系中的四个不同声调的字 母。33.一个键盘与第三十二请求权相关,越 靠近键盘中间区域的字键,越适用于 安排高频率的字母。34.一个键盘与第三十三请求 权相关,其 中 (1)一个字键有上、下两档的状态; (2)下档字键适用于安排高频率字母。35.一个汉字 处理的方法,包括下列一些 步骤输入一串拼音中文字母,每个字 母各标明了汉语的声、韵、调,该字 母串包括至少两组字母,每一组字母 确定一个不等长的拼音字,每个 拼音字只代表唯一的一个汉字同 时又提供了那个汉字的全部发音信息 包括声、韵、调部件和音调节;又从 处理这个字母串的程序中毫无疑问的 去确定每一个拼音字的开始和终 端。36.一个方法与第三十五请求权相关,又 包括从这些识别的拼音字,借重 一个汉字库,即可明确的鉴定与 拼音字对应的汉字。37.一个方法,去建立 与创造按音字序 排列的词组,每个词组包括一个或 多个词,词与词之间是以空白键相隔 ,每个词包括多个字母,字母组成一 个或多个拼音字,每个拼音字 代表一个,唯一的一个,汉字 同时提供汉字发音的音调节和其 声、韵、调、部件,该字母组占有预 定的字母序,该程序包括的步骤 : 将一套词组按音字序排列, 在那里面首先词组是按词中字母的 字母序排列的,该顺序又在下列的 范围内被修改,(1)前面有相同汉字的 词组是列在一起的,(2)所有的同调 字,虽是不同的并写法也是列在一 起的;在(1)和(2)两组中的词组是按 字母序排列的。38.一个处理字母串的方法,包括 1.输入一串拼音中文字母,在那里面 (1)该拼音中文字母包括一双声母、 半声母、韵调母和一个零声母[ 、 、 、 ]{C,S,V,Z}; (2)该字母串包括至少两个拼音字 {POW},每个拼音 字的式样是[ + ]{TS +Q},在那里面[ ]{TS }是音调节具有下列四个格 式之一: [ ,, , ]{CV,CSV ,SV,V},另[ ]{Q}是 扩意义标,有两个可能的格式 ,即定字义标(任何一个拼 音中文字母,除[#79]只用 作儿化韵以外),或无义 标{null set}; (3)每一个拼音字只代表一个, 唯一的一个汉字同时明确的提供 代表汉字的音调节及其声、 韵、调部件;和 (4)拼音字的格式是[ + ] {SV+Q}或是[ + ]{ V+Q}如有前置拼音字连写时 必须在拼音字前加一个零声 母;前者只是前置拼音字的字 尾是声母时才必须加零声母。 2.从输入的字母串中,将其中所含的 拼音字毫无模棱两可的一一分开。39.一个方法与 第三十八请求权相关,继 续包括,求助于一个汉字库,每 个拼音字即可明确的转换成与其 唯一相对应的汉字。40.一个方法与第三十八请求 权相关,包 括 (1)为拼音中文字母确定一套预定的 字母序排列 (2)输入至少两个拼音中文字母的拼 音词; (3)用音字序排序程序为拼音词排 音字序,在那里面该拼音词 是按词中字母的字母序排列 ,这个按字母序的排列再经过 下列的修改,(1)凡是前面有相同汉 字的词是排在一起的,和(2)所有的 同调字,却或是不同的拼写法 ,也是排在一起的;在(1)和(2)这两 队中的拼音词是各按字母序排 列。41.一个为汉字建立代码和存储汉字的方 法,包括 (1)选择一套字母作 拼音中文字母 ,[ ]{ }它们具有为全部汉语拼音定调 的功能,可以准确的拼出所有汉 语(国语或普通话)的音调节 ; (2)为每一个拼音中文字母选择一个, 唯一的一个,七位二进制{7-bit }二进制代码{digital rep- resentation}; (3)选择一套汉字,为其建立代码和存 储; (4)选择一个,唯一的一个,拼音字 [ ]{ }去识别(代表 )每一个被选的汉字; (5)存储一个汉字库(单音节), 其中每一个被选汉字的点绘汉字 图形式代码{Digital repres- entation}与其相对应的拼音 字(二进制代码)达到唯一性的 转换。(见第一请求权)。42.一个方法与第四十一 请求权相关,在 那里面,拼音中文字母的二进制代 码是在128-255(8OH-FFH) 范围之内。43.一个方法与第四十二请求权相关,在 那里面,拼音中文字母的二进制代 码是在128-223(8OH-DFH) 范围之内。44.一个方法与第四十一请求权相关,在 那里面,拼音中文字母的二进制代 码是在128-213(81H-D5H) 范围之内。
地址 美国