发明名称 英汉翻译系统的词法分析算法
摘要 英汉翻译系统的词法分析算法系采用人工智能技术,基于英语基本单词库、不规则单词库、规则变化后缀库和不需要再进行词法分析单词库四个知识库之上的,算法应用逻辑推理对英语单词进行原形单词和形变单词分析后,转换成原形单词和附加词形特征属性,最终生成供机译系统的分析一转换用的单词内部结构。本算法提供全新的查询单词的方法,克服了许多形变单词在电子词典中无法查到的现象,可用于英汉翻译系统或英汉电子词典中。
申请公布号 CN1134567A 申请公布日期 1996.10.30
申请号 CN95119582.4 申请日期 1995.11.29
申请人 陈肇雄 发明人 陈肇雄
分类号 G06F17/28 主分类号 G06F17/28
代理机构 北京市专利事务所 代理人 张卫华
主权项 1.一种由逻辑运算部件、存储部件、视频显示部件和含英语字母键的键盘组成的英汉翻译系统的词法分析算法,其特征在于:(一)首先建立四个知识库,即:英语基本单词库、规则变化后缀库、不规则变化单词库、不需要再进行词法分析的单词库,其中:1)英语基本单词库中每个单词有如下的内容:●原形单词符号●单词的分类标识符和词义属性标识符●上下文区分函数●单词的中文解释●该单词的词组并用多级分类算法建立英语基本单词库的索引文件;2)规则变化后缀库中每条后缀有如下的内容:●后缀●添加字符●条件●追加的词形特征属性符号并按末字符建立规则变化后缀库的索引文件,采用所有相同末字符的后缀存贮在一起的原则组织存贮;3)不规则变化单词库中每个不规则单词有如下的内容:●不规则单词●原形单词●追加的词形特征属性符号并为不规则变化单词库建立索引文件;4)不需要再进行词法分析的英语单词库中的内容为英语单词的集合;(二)每接收一个英语单词之后,执行如下词法分析步骤:(1).访问英语基本单词库,查询该单词是否在库中,如果不在,则执行步骤(2);如果在,则记录已有一个英语原形单词,继续执行步骤(2);(2).访问不需要再进行词法分析的单词库,如果该单词在该库中,则不进行变形单词分析,直接执行步骤(7);(3).如果该单词具有所有格,即单词末尾有′或′S,则首先记录该单词的所有格词形特征属性,然后去掉单词末尾的′或′S,然后从步骤(1)开始执行;(4).访问不规则变化单词库,如果该单词在该库中,则直接从该库中取出该单词的原形单词和追加的词形特征属性,并记录下来,然后执行步骤(7);(5).按照步骤(6)遍访规则变化后缀库中的每一条后缀,遍访结束后执行步骤(7);(6).如果根据当前位置的后缀,能将该单词分离成该单词的原形单词和后缀两部分,则直接取出原形单词,从该后缀词条中取出追加的词形特征属性,并记录下来,然后取出下一条后缀按步骤(5)继续执行;(7).如果该单词没有原形单词,则转例外出错处理;(8).如果该单词有一个或多个原形单词时,则按照单词的内部存贮结构,逐个生成原形单词的内部存贮结构;(9).如果该单词有多个原形单词时,则按照单词的存贮结构中的属性值链表和词组链表分别合并;(10).词法分析结束。
地址 100080北京市2704信箱