发明名称 用于周边构件的语言辨识系统和方法
摘要 一种资料处理系统因应于多种输入语言,每一种语言带有既定之语法。在所输入资料中为所定义资料部份的存在(“For”键)显示出一赞成有某一语言存在之投选,而所定义资料之其它部份的存在(“Against”键)则显示出一反对该语言存在的投选。此系统执行下述用以辨识输入语言的方法:就每一被预期之语言,分析输入资料块之语法,以辨识出在该资料块中之各赞成(For)与反对(Against)键;响应于该分析,提供每一被预期语言的赞成与反对得分,每一该得分为键输入之总和,而每一键输入则包含一已乘以一偏移值之经辨识键的计数,该偏移值显示出该键在该资料块之语法与前后文关系中之重要性,该赞成之得分为所有赞成键输入之总和,而该反对之得分为所有反对键输入之总和;比较该赞成与反对之得分,以判定他们是否太接近而无法确定;以及,根据该资料块之进一步语法特性,解决该不确定性,并根据其中一得分显示出某一值;或者在各得分之间没有不确定性存在时,显示出一由该较大得分值所推得之值;并根据对于每一被预期语言所显示出来之值,决定所收到之语言的身分。
申请公布号 TW202508 申请公布日期 1993.03.21
申请号 TW081108886 申请日期 1992.11.06
申请人 惠普公司 发明人 席恩E.瓦顿
分类号 G06F15/38;G10L7/08;H04L12/48 主分类号 G06F15/38
代理机构 代理人 蔡坤财 台北巿松江路一四八号十二楼之三;恽轶群 台北巿松山区南京东路三段二四八号七楼
主权项 1﹒一种用以辨识输入语言的方法,其在一响应于 多种输入语言的资料处理系 统中,且其中每一种语言带有一既定语法,而在所 输入资料中为所定义资 料部份的存在("For")显示出一赞成有其一语言存在 之投选,而所届@ w义资料之其它部份的存在("Against"键)则显示出一 反对该语芋@ 它s在的投选,其步骤包含:(a)就每一被预期之语言, 分析输入资料间@ 穭宏y法,以辨识出在该资料块中之各赞成(For)与反 对(Agai╮@ 髍屣 ^键;b)响应于该分析,提供每一被预期语言的 赞成与反对得分﹛@ A每一该得分为所有键输入之总和,而每一键输入 则包含一已乘以一偏移迭@ 孛g辨识键的计数,该偏移値显示出该键在该资料 块之语法与前后文关哄@ Y中之重要性,该赞成之得分为所有质成键输入之 总和,而该反对之得分活@ 骨狾酗牊嬼靽擗J之总和;(C)比较该赞成与反对之 得分,以判定他们活@ O否太接近到无法确定,并根据该资料块之进一步 语法特性解决该小确定届@ 吽A并显示出一根据代中一得分所得之値,而此显 示则依该进一步语法特届@ 坅Y显示出赞成或反对该语言而定;(d)在各得分之 间没有不确定性存式@ b时,显示出一由该较大得分値所推得之値;以及(e) 根据每一相对于腹@ 茬Q预期语言所显示出来之値,决定所收到之语言 的身分。 2﹒如申请专利范围第1项所述之方法,其中,该(a)步 骤还包含以下步骤 :依键类型,类分各个已辨识之赞成与反对键;以一 指定给每一键类型之 加权値增加或减少一语言投选计数,而该增量或减 量为一预先指定给该键 类型之具正负号的键类型加权値,每当该键被判定 时,该投选値即因赞成 之键类型而增量,并因反对之键类型而减量。 3﹒如申请专利范围第2项所述之方法,其中该步骤( c)界定之进一步语法 特性系到底该语言投选计数是大于或小于一既定 値。 4﹒如申请专利范围第3项所述之方法,其中,该赞成 之键类型包含:语法上 一致之字元与序列,而该反对之键类型则包含语法 上不一效之字元与序列 、语法上之错误、不识之字、以及不合法之序列 。 5﹒如申请专利范围第3项所述之方法,其中每一键 类型之偏移为一键类型之 初始偏移値受封一而移修正器所作之修正,而该偏 移修正器则性该初始偏 移他因该键类型之在行料块中第二次及后续出现 而不同。 6﹒如申请专利范围第5项所述之方法,其中,当在一 资料块中后续出现之键 类型更显示出系某一种语言时,该该偏移修正器为 一乘法器,且其中,当 一资料块中后续出现之键类型不再同于该资料块 中首次出现之该键类型般 将其辨识成某一语言时,该偏移修正器为一除法器 。 7﹒如申请专利范围第6项所述之方法,其中,每当该 初始偏移他受到一偏移 修正器之修正时,或下一次该偏移受到该偏移修正 器之修正时,系先前经 修正之偏移値受到更改,因此,在一序列偏移修正 期间,将在各偏移値中 发生一非线性变化。 8﹒如申请专利范围第7项所述之方法,其中,在步骤 (b)之后,本方法还 执行额外步骤:即将该赞成与反对之得分与每一种 得分所可能获得之最大 値相比较,若任一种得分都在该最大値之一预定限 度内,则终止该根据步 骤(b)所行之对该资料块之进一步分析,而直接前进 至步骤(c)。 9﹒如申请专利范围第2项所述之方法,其中,该不确 定之判定系藉由计算该 赞成与反对两名之得分差,并将该差与两者之差所 预期之最大値相比较而 得,而且系在比较之结果显示出该差大于该最大差 之一预定百分比时,显 示出该两得分间之选取有混淆情形。 10﹒如申请专利范围第9项所述之方法,其中,该等 输入语言包括PCL, 而且在响应于一混淆之指示时,一PCL投选器模组将 执行以下之进一 步步骤:即判定一PCL语言投选计数是否大于一既定 値,若没有,则 显示出一由该反对之得分所推衍而出上値,若有, 则显示出一出该赞成 之得分所推得之値。 11﹒如申请专利范围第9项所述之方法,其中,该输 入语言包括PostS cript语言,而且一PostScript选器模组会响应于一混 淆之指示,而执行如下之进一步步骤:即判定在该 资料块之分析中是否 没有检测出语法错误,且在PostScript语言中是否检 测出一 特定字元,若没有,则显示出一由该反对得分所推 得之値,若是的话, 而且该语言之投选値大于该既定値,则显示出一由 该赞成得分所推得之 値。 12﹒如申请专利范围第1项所述之方法,其中,该比 较步骤c)还包括以下 步骤:将该赞成与反对之得分映成在一预定范围内 之各値,且每一该得 分系根据该得分相对于一该得分所能到达之最大 値之相互关系而被映成 该预定范围内之各値。 13﹒一种资料处理系统,其包括软体,且此系统响应 于多种输入语言,每一 种语言带有既定之语法,且其中在所输入资料中为 所定义资料部份的存 在("For"键)显示出一赞成有某一语言存在之投选, 而所定义资料 之其它部份的存在("Against"键)则显示出一反对该 语言存在 的投选,此系统还包括一供每一语言用之投选器设 施,以及一决定器设 施,该每一投选器设施包含:语法设施,用以就每一 被预期之语言,分 析输入资料块之语法,以辨识出在该资料块中之各 赞成(For)与反 对(Against)键;得分设施,用以响应于该分析,提供该 被预 期语言的赞成与反对得分,每一该得分为键输入之 总和,而每一键输入 则包含一已乘以一偏移値之经辨识键的计数,该偏 移値显示出该键在该 资料块之语法与前后文关系中之重要性,该赞成之 得分为所有赞成键输 入之总和,所该反对之得分为所有反对键输入之总 和;第一比较设施, 用以比较该赞成与反对之得分,以判定他们是否太 接近到无法确定,并 根据该资料块之进一步语法特性解决该不确定性, 并显示出一根据其中 一得分所得之第一値;以及,用以将该第一値或一 第二値送给该决定器 设施之设施,其中该第二値系在各得分之间没有不 确定性产生时由较大 得分者推衍而得之値。 14﹒如申请专利范围第13项所述之资料处理系统, 其中该决定器设施包含 :用以检查来自每一投选器设施所显示出之値,并 藉以决定该输入资料 块所实行之语言的身分之设施。 15﹒如申请专利范围第14项所述之资料处理系统, 其还包含:用以依键类 型类分经辨识过之赞成键与反对键的设施;以及加 权设施,用以在一语 言投选计数上增加或减少一指定给每一键类型之 加权値,而该增量或减 量乃一预先指定给该键类型之具有正负号的键类 型加权値,每当有一该 键被判定出来时,该投选値即因赞成之键类型而被 增加,或因反对之键 类型而被减少。 16﹒如申请专利范围第15项所述之资料处理系统, 其中该进一步语法特性 系到底该语言投选计数是大于或小于一既定値。 17﹒如申请专利范围第15项所述之资料处理系统, 其中每一键类型之偏移 为一键类型之初始偏移値受到一偏移修正器所作 之修正,而该偏移修正 器则使该初始偏移値因该键类型之在资料块中钢 二次及后续出现而不同 。 18﹒如申请专利范围第17项所述之资料处理系统, 其还包含:第二比较设 施,用以将该赞成与反对之得分与每一种得分所可 能获得之最大値柑比 较,若任一种得分都在该最大値之一预定限度内, 则终止该得分设施所 施行之对该资料块之进一步分析,而作动该第一比 较设施。 13﹒如申请专利范围第18项所述之资料处理系统, 其中该第一比较设施系 藉由计算该赞成与反对两者之得分差,并将该差与 两者之差所预期之最 大値相比较而产生该不确定之判定,而且系在比较 之结果显示出该差大 于该最大差之一预定百分比时,显示出该申得分间 之选取有混淆情形。 14﹒如申请专利范围第13项所述之资料处理系统, 其中,该投选器设施包 括用以将该赞成与反对之得分映成一倾定范圈内 之各値的设施,且每一 该得分系根据该得分相对于一该得分所能到达之 最大値之相互关系而被 映成在该预定范围内之各値。 21﹒如申请专利范围第20项所述之资料处理系统, 其中,该决定器设施会(1)在所有投选器设施皆产出 表示反对之得分値时,显示出其系非语 言(2)在最大之赞成得分値由某一投选器设施产出 时,显示其系某一 语言。图示简单说明 第1图为一具体化木发明语言辨识程 序之系统的方块图。 第2图为一列出在第1图所示该语言 辨识程序内之一投选器模组中之各副常式 的列表。 第3图为一pCL(一种印表机控制语 言)之语法定义。 第4图为PostScript(一种印表机控 制语言)之语法定义。 第58图例举在该PostScript语言中之 各键的加权表。 第56图例举在该PCL语言中之各键的 加权表 第6图为该PostScript语言之前后文 关系表。 第7图为PCL语言之前后文关系表。 第8至第11图例举一藉由第1图所示 系统所执行之语言辨识程序的高阶流程图
地址 美国