发明名称 一种英汉翻译机器的实现方法
摘要 一种英汉翻译机器的实现方法。其特征是采用任意常项和任意变项的模板匹配替换通用算法,在对源语言的句子进行翻译时,只需利用该算法将句子与模板翻译规则库的规则按顺序进行比较,匹配成功一部分,则翻译一部分,如果整个句子完全匹配成功,就可以获得高质量的翻译结果。本发明除了能够高质量地翻译符合文法结构的句子外,同时还能够较好地翻译不太符合文法结构的句子。
申请公布号 CN1302415C 申请公布日期 2007.02.28
申请号 CN00109235.9 申请日期 2000.06.19
申请人 李玉鑑 发明人 李玉鑑
分类号 G06F17/27(2006.01) 主分类号 G06F17/27(2006.01)
代理机构 代理人
主权项 1、一种英汉翻译机器的实现方法,它的硬件含有逻辑运算部件、存储部件、视频显示部件和输入部件,其特征在于所述翻译机器采用具有任意常项和任意变项的模板匹配替换通用算法,该方法执行以下步骤:(1)从输入部件输入或者从存储部件读取要翻译的源语言中的句子,并将它显示在视频显示部件上;(2)启动执行算法的功能选项,将句子分解并表示为以源语言中的词汇、标点这类为基本单元的信息属性结构,记录“句子长度变量”=基本单元的数目;(3)对句子中的每个基本单元进行形态分析,并记录它的所有词类代码和每个词类在目标语言中的所有可能含义,并令“规则计数变量”=1;(4)如果规则计数变量大于模板翻译规则库的规则总数,则进入(8);否则从模板翻译规则库中取出规则计数变量所指向的模板翻译规则作为当前规则,然后取出该规则的源语言模板作为当前源语言模板,记录“源语言模板长度变量”=它所包含的常项和变项的总数,如果源语言模板长度变量大于句子长度变量,令规则计数变量=规则计数变量+1,返回(4);否则,令句子“匹配起始位置变量”=1,“匹配终止位置变量”=匹配起始位置变量+源语言模板长度变量-1,然后进入(5);(5)令“当前匹配位置变量”=匹配起始位置变量,进入(6);(6)将当前匹配位置变量在句子中所指的项记为“句子匹配项”,将“当前匹配位置变量-匹配起始位置变量+1”的值在源语言模板中所指的项记为“模板匹配项”,判定句子匹配项是否与模板匹配项匹配,判定标准是:a.如果这两项都是常项,那么只需通过形态分析看它们在源语言中是否为同一个词汇的不同形态,是则匹配成功,否则匹配失败;b.如果句子匹配项为常项,而模板匹配项为变项,则看句子匹配项具有的所有可能类型代码中是否存在被模板匹配项所包含的代码,存在则匹配成功,不存在则匹配失败;c.如果句子匹配项为变项,模板匹配项也为变项,则当句子匹配项被模板匹配项所包含时,匹配成功,否则匹配失败;d.如果句子匹配项为变项,而模板匹配项为常项,则匹配失败;如果根据该标准判定结果为匹配成功,那么当当前匹配位置变量=匹配终止位置变量时,进入(7),当当前匹配位置变量<匹配终止位置变量时,令当前匹配位置变量=当前匹配位置变量+1,返回(6);如果根据该标准判定结果为非匹配成功,令匹配起始位置变量=匹配起始位置变量+1,匹配终止位置变量=匹配终止位置变量+1,如果匹配终止位置变量≤句子长度变量,则返回(5),否则令规则计数变量=规则计数变量+1,返回(4);(7)此时句子中对应于从匹配起始位置变量到匹配终止位置变量的项与当前源语言模板完全匹配,记录“当前源语言模板的类型代码”,以及句子中对应于从匹配起始位置变量到匹配终止位置变量的项与当前源语言模板中变项相对应的所有项,将这些项在目标语言中的意义对应代入当前源语言模板的所有目标语言模板,并把得到的结果作为当前源语言模板的类型代码在目标语言中的翻译结果集;然后将句子中对应于从匹配起始位置变量到匹配终止位置变量的所有项用当前源语言模板的类型代码替换,并把得到的结果记录为新的句子状态,令句子长度变量=句子长度变量-源语言模板长度变量+1,显然代码替换后句子对应于匹配起始位置变量的项变为当前源语言模板的类型代码;如果句子长度变量=1,则进入(8);如果句子长度变量>1,当匹配终止位置变量不超过句子长度变量时,返回(5),当匹配终止位置变量超过句子长度变量时,令规则计数变量=规则计数变量+1,返回(4);(8)将句子的各项在目标语言中的翻译结果集取出,此时翻译结果集的个数恰好与句子长度变量相等,而且如果匹配完全成功,则翻译结果集只有一个,句子长度变量等于1;将这些翻译结果集中的字符串按顺序连接起来,得到最终翻译结果集,进入(9);(9)直接将最终翻译结果集中的第一个翻译结果显示在视频显示部件上作为在(1)中输入的句子最终翻译结果,或者将最终翻译结果集中的字符串优化排序后,将最可能的字符串作为在(1)中输入的句子最终翻译结果;也可将最终翻译结果集中的部分或所有字符串列举在某个选择框中,由用户去选择在(1)中输入的句子的最终翻译结果。
地址 100022北京市朝阳区平乐园100号北京工业大学计算机学院