发明名称 自动辨识于其中数位资料被接收到之语言的方法
摘要 本发明之自动语言辨识方法包含从被接收到之资料中选择一资料区块以及搜寻该区块中 "支持" 或是 "否定"一特定语言之存在之要素。辨识之执行系藉由以一预先设定之次序搜寻多数个已知之语言,以及藉由对每一语言进行至少为一个之该语言之特征要素之搜寻,于该资料区块中。此辨识可以开始于搜寻具有一特殊标记之语言,然后搜寻具有同步化字元或是关键字之语言,然后再搜寻使用由一已经决定数目之有效字元所构成之记忆符号之语言。本方法系用来自动选择一译解模组以为将该被接收到之资料的解码之用,特别是被一个绘图机所接收到之资料。本方法亦可应用于检测在该被接收到之资料中之语言之一错误、一旗号,或是一变换。
申请公布号 TW311997 申请公布日期 1997.08.01
申请号 TW084107070 申请日期 1995.08.14
申请人 OCE尼德尔兰公司 发明人 拉克.吉尼塔;瑞内卡.伊文;罗伯特斯.可那里斯.维里布洛达斯.瑟德洛斯.马利亚;.凡登堤拉
分类号 G06F15/38 主分类号 G06F15/38
代理机构 代理人 林镒珠 台北巿长安东路二段一一二号九楼
主权项 1.一种自动辨识于其中数位资料被接收到之语言的方法,该方法包括于被接收到的资料中选择一资料区块,并且在该区块中搜寻有助于指出一语言存在或是不存在的要素,其特征在于:辨识之执行系藉由以一预先设定之次序搜寻多数个已知之语言,以及藉由对每一语言进行,于该资料区块中,至少为一个之该语言之特征要素之搜寻。2.如申请专利范围第1项中所述之方法,其特征在于:该语言搜寻次序系依辨识照错误机率增加之次序来进行。3.如申请专利范围第1或2项中所述之方法,其特征在于:搜寻系开始于搜寻具有一特殊标记之语言。4.如申请专利范围第3项中所述之方法,其特征在于:具有一特殊标记之语言系依照标记长度降低之次序进行搜寻。5.如申请专利范围第3项中所述之方法,其特征在于:该搜寻于是继续进行,搜寻具有特殊关键字或是同步化宇元之语言。6.如申请专利范围第3项中所述之方法,其特征在于:该搜寻接下来系以使用记忆符号之语言继续进行搜寻,其中该等记忆符号系由已经决定数目之有效字元所构成。7.如申请专利范围第6项中所述之方法,其特征在于:为了在一群语言中自动辨识一个语言,其中该群语言系为数个使用由已经决定数目之有效字元所构成的计忆符号之语言,此方法包含至少以下之步骤:储存属于该群语言之记忆符号,其中系包括属于该群语言之一者或是一部分语言之区别性记忆符号,以及不属于该群语言中之其它语言之区别性记忆符号;将该等被储存之记忆符号与各组形成该被选择之区块之某部分之字元比较,其中该等字元须具有一长度和该等被储存之记忆符号之长度相同;以及在比较的步骤中,如果一组字元系被检测出对应至一区别性记忆符号的话,则该区别性记忆符号不属于之该(等)语言系被消除。8.如申请专利范围第7项中所述之方法,其特征在于:如果在比较步骤中,一组字元系被检测出对应至一记忆符号,且其中该记忆符号只属于该群语言中之仅仅单一之语言中的话,则该单一语言系被认为已经被辨识出。9.如申请专利范围第8项中所述之方法,其特征在于:对于每一个记忆符号属于多数个在该群语言中之语言并且通常其后跟随着,在一组经过编码之资料中,预先设定数目之参数,而其中该等参数对于该等语言之每一个系为特定的参数,与每一个语言之记忆符号相关连的该等预先设定数目之参数系被储存起来;以及如果在比较步骤的过程中检测出一组字元,同时该组字元系对应至属于该多数个在群语言中之语言,并且通常后面有参数跟随着或是没有参数跟随着的话,则在该资料区块中跟随着该被检测出之记忆符号的参数的数目系被计数,并且对于关连于各种不同语言之每一个之该记忆符号,与其所储存之该等参数的数目相比较,同时,对于所储存之参数的数目与经过计数之参数的数目相等之语言,系被认为已经被辨识出。10.如申请专利范围第8项中所述之方法,其特征在于:被认为已经被辨识出之该语言,系可以藉着确认,至少在该区块从该第一个被有效地检测出之记忆符号开始的一部分长度中,该资料区块未含有对于该语言为错误之参数以及/或是记忆符号,来证实语言之辨识。11.如申请专利范围第1或2项中所述之方法,其特征在于:在其中执行语言存在的搜寻之资料区块或是观察视窗的长度系可以变化的。12.如申请专利范围第11项中所述之方法,其特征在于:该观察视窗的长度之变化系为用来进行搜寻之语言类型的函数。13.一种自动选择一个用来将被接收到的数位资料解码之译解模组之方法,此方法包含:从被接收到之资料中选择一资料区块;自动辨识一语言,其系藉着在该资料区块中,从多数个可能被用来为该资料写码之语言中搜寻有助于指出一特定语言存在或是不存在的要素,以及选择一对应至该经过辨识之语言的译解器;此方法之特征在于:自动语言辨识之执行系使用申请专利范围第1至4项中任一项所述之方法。14.一种自动选择一个用来将被接收到的数位资料解码之译解模组之方法,此方法包含:从被接收到之资料中选择一资料区块;自动辨识一语言,其系藉着在该资料区块中,从多数个可能被用来为该资料写码之语言中搜寻有助于指出一特定语言存在或是不存在的要素,以及选择一对应至该经过辨识之语言的译解器;此方法之特征在于:当一语法错误系为该译解模组被检测出之时,解码之进行系被插断,同时自动语言辨识方法系被重新开始于下列步骤之至少一者:a)在被接收到的资料中检测一错误之存在,并且处理该错误;b)在被接收到的资料中检测一旗号之存在,并且处理该旗号;以及c)检测在语言上之一变换,并且选择对应至该新被辨识出之语言之译解模组。15.如申请专利范围第14项中所述之方法,其特征在于:自动语言辨识之执行系使用申请专利范围第1至12项中任一项所述之方法。16.如申请专利范围第14或15项中所述之方法,其特征在于:一错误或是一旗号系被检测出且可以被处理,只要是在一语法错误被检测出之后被辨识出之语言系与先前之语言相同,并且一偏移系存在于该数位资料流中介于该语法错误开始之处与相同的语言被再度辨识出之源头之间。17.如申请专利范围第14或15项中所述之方法,其特征在于:一个旗号系被检测出且可以被处理,只要是该经过辨识之语言在一语法错误被检测出之后系不同于先前之语言,同时一偏移系存在于该数位资料流中介于该语法错误开始之处与该新的语言被辨识出之源头之间,并且在确认其间没有任何语言之后。18.如申请专利范围第13至15项中任一项所述之方法的使用,系为用于将一显示器或列印装置所接收到之数位资料解码。图示简单说明:第一图系为一自动辨识语言的方法之整体流程图,在该语言中藉着一绘图机被接收到之数位资料系被编码;第二图系为在第一图中之方法之一个阶段之一较详细之流程图,系关于标记之搜寻;第三图系为在第一图中之方法之一个阶段之一较详细之流程图,系关于关键字之搜寻;第四图系在第一图中之方法之一个阶段之一较详细之流程图,系关于CALCOMP语言之自动搜寻;第五图与第六图系为在第一图中之方法之一个阶段之一较详细之流程图,系关于一个使用记忆符号之语言之自动辨识;第七图与第八图系为使用一自动语言辨识之方法之流程图,其系关于从藉着一绘图机所接收到之数位资料中自动检测以及移除错误与旗号之方法;第九A图至第九F图显示数位资料区块之部分,显示用来自动检测与消除错误与旗号之方法,特别是在第七图与第八图中所显示之错误与旗号;以及第十图系为方块图,显示由用于处理一个绘图机所接收到之数位资料之一单元(unit),在该数位资料中系具有用来绘图之视图。
地址 荷兰