发明名称 德汉翻译系统的词法分析方法
摘要 本发明采用人工智能技术,建立在德语基本单词库、不规则单词库、规则变化词缀库、缩写词库和不需要再进行词法分析的单词库四个知识库之上,算法应用逻辑推理对德语单词进行原形单词和形变单词分析后,转换成原形单词和附加的词形特征属性,最终生成供机译系统的分析—转换用的单词内部结构。本算法提供全新的查询单词的方法,克服了许多形变单词在电子词典中无法查到的现象,可用于德汉翻译系统或德汉电子词典中。$#!
申请公布号 CN1063559C 申请公布日期 2001.03.21
申请号 CN95108230.2 申请日期 1995.07.26
申请人 深圳科智语言信息处理有限公司北京分公司 发明人 陈肇雄
分类号 G09B19/06 主分类号 G09B19/06
代理机构 北京市专利事务所 代理人 张卫华
主权项 1.一种由逻辑运算部件、存储部件、视频显示部件、输入部件组成的德汉 翻译系统的词法分析方法,其特征在于: (一)建立五个知识库,即:德语基本单词库、规则变化词缀库、不规则变 化单词库、缩写词库、不需要再进行词法分析的单词库,其中: 1)德语基本单词库中每个单词有如下的内容: ·原形单词符号 ·单词的分类标识符和词义属性标识符 ·上下文区分函数 ·单词的中文解释 ·该单词的词组 并采用多级分类算法建立德语基本单词库的索引文件; 2)规则变化词缀库中每条词缀有如下的内容: ·词缀 ·添加字符 ·条件 ·追加的词形特征属性符号 并按首字符或末字符建立规则变化词缀库的索引文件,采用所有相同首字符 的前缀存贮在一起、所有相同末字符的后缀存贮在一起的原则组织存贮; 3)不规则变化单词中每个不规则单词有如下的内容: ·不规则单词 ·原形单词 ·追加的词形特征属性符号 4)缩写词库以含′为特征,有如下内容: ·缩写词 ·该词的完整词形 5)不需要再进行词法分析的德语单词库中的内容只有德语单词的集合; (二)在接收一个德语单词之后,执行如下词法分析步骤: 1)首先访问德语基本单词库,查询单词是否在库中,如果不在,则执行步 骤2);如果在,则记录已有一个德语原形单词,继续执行步骤2); 2)通过访问不需要再进行词法分析的单词库,如果该单词在该库中,则不 进行变形单词分析,直接执行步骤7); 3)如果该单词具有缩写形式,即单词中有’号,则查找缩写词库,取出全 形词,然后从步骤1)开始执行; 4)访问不规则变化的单词库,如果该单词在该库中,则直接在不规则单词 库中取出该单词的原形单词和追加的词形特征属性,并记录下来,然后执行步骤 7); 5)按照步骤6)遍访规则变化词缀库中的每一条词缀,遍访结束后执行步 骤7); 6)如果根据当前规则的词缀,能将该单词分离成该单词的词干和词缀两部 分,则直接取出原形单词并从该词缀规则中取出追加的词形特征属性,并记录下 来,然后取出下一条词缀规则按步骤5)继续执行; 7)如果该单词没有原形单词,则转例外出错处理; 8)如果该单词有一个或多个原形单词时,则按照单词的内部存贮结构,逐 个生成原形单词的内部存贮结构; 9)如果该单词有多个原形单词时,则按照单词的存贮结构中的属性值链表 和词组链表分别合并; 10)词法分析结束。
地址 100088北京市海淀区知春路22号