发明名称 自动翻译器及其方法和用于编写该方法的记录媒体
摘要 本发明涉及自动翻译器、由该自动翻译器所使用的自动翻译方法和用于编写该自动翻译方法的记录媒体。本发明使句子的翻译(英语句子<=>中文句子)更正确、自然。因为在将英语翻译为中文及将中文翻译为英语时,通过特定的算法将中文语法的特殊属性考虑在内了。特定算法是本发明的主要概念。本发明的自动翻译器由以下各项所组成:1)词库(100);2)分析装置(200);3)排列装置(300);4)装置(400)-调节性翻译模块;5)装置(500)-特定翻译模块;6)装置(600)-一般翻译模块;7)装置(700)-其输出完整的中文译句。与装置(500)(即特定翻译模块)链接的特定句子元素的链接指针与5个(特殊)翻译模块(501~505)相互配合。通过1)、2)、3)、4)、5)、6)、7)的过程和第一特定翻译模块(501)至第五特定翻译模块(505),可使句子的翻译(英语句子<=>中文句子)更正确、自然。本发明已通过本申请人于2003年3月开发的演示程序(应用了特定的算法)得到了完全证实。具体实施方式和图5、6、7、8、9中的所有示例句子都是从演示程序引用的。
申请公布号 CN1910574A 申请公布日期 2007.02.07
申请号 CN200580002031.X 申请日期 2005.01.03
申请人 李仁燮 发明人 李仁燮
分类号 G06F17/28(2006.01) 主分类号 G06F17/28(2006.01)
代理机构 中国商标专利事务所有限公司 代理人 万学堂
主权项 1.一种自动翻译器,其由以下各项组成:(1)词库(100):其具有4个对应的词典数据库;每个数据库均以字母顺序排列,并且根据英语和中文语言的词典编辑系统记录了英语单词和中文译词的全部信息;(2)装置(200):其将输入的原始句子的单词分析成词素单位;(3)装置(300):其针对包含词性的基本句子元素排列装置(200)的结果,并且根据词典数据库将原始的英语单词翻译成中文的字词;(4)装置(400)——调节性翻译模块:其检查在(300)的结果中是否存在复合词、习惯用语、俗语;如果存在,则该装置将它们的基本句子元素调节成调节性句子元素,如果需要,转换它们的词性(在该过程中,创建新转换的词类);并且该装置根据词典数据库将原始的英语单词翻译为中文字词;(5)装置(500)——特定翻译模块:其检查(300)的结果、(400)的结果,并通过特定句子元素的链接指针检查所输入的原始句子;如果两者之间存在链接数据,则特定句子元素的链接指针检查单词的数据是否标有辨别因子;如果是,则特定句子元素的链接指针和辨别因子指示单词应由5个(特殊)特定翻译模块之一来控制;特定翻译模块的装置(500)具有5个(特殊)特定翻译模块(501-505),由特定句子元素的链接指针和辨别因子共同激活;并且该装置重新检查每个(特殊)特定翻译模块的结果并根据中文语言的词序规则重新排列中文译词和词序;(6)装置(600)——般翻译模块:其检查(500)的结果,并根据中文语法的特殊翻译状况删除最终中文译句中不需要的中文译词,并插入最终中文译句中需要的特殊中文字词;并且该装置重新检查第二次翻译出的中文字词(其由特定翻译模块再次转换而来)是否与词库的词序规则有联系;如果是,则该装置根据中文语言的词序规则重新构造中文译词;(7)装置(700):其输出完整的中文译句;与装置(500)(即特定翻译模块)链接的特定句子元素的链接指针与5个(特殊)特定翻译模块(501~505)相互配合;第一特定翻译模块(501)通过特定句子元素的链接指针与辨别因子检查原始英语句子翻译出的中文动词是否属于离合词;如果其属于离合词,则该模块通过特定句子元素的链接指针与辨别因子检查原始的英语句子是否是过去时态;结果是肯定的,该模块将“了”字插入翻译出的中文动词的双音节或三音节(其也分成两部分)词之间;同时,该模块通过特定句子元素的链接指针和辨别因子检查原始的英语句子是否具有频率副词;如果具有,则该模块通过特定句子元素的链接指针和辨别因子将英语频率副词的中文译词紧跟在“了”字后面;如果原始的英语句子不是过去时态,则放置英语频率副词的中文译词即可,不需要加“了”字;第二特定翻译模块(502)通过特定句子元素的链接指针和辨别因子检查中文译词是否存在作为句子元素的程度补语;如果存在,则特定句子元素的链接指针和辨别因子检查程度补语是否伴随原始英语句子翻译出的中文动词;如果是,则该模块在翻译出的中文动词后面紧接着插入中文字“得”(在中文句子中表示动词的程度的中文字);并且该模块将程度补语的中文译词紧跟在“得”字之后;第三特定翻译模块(503)通过特定句子元素的链接指针和辨别因子来检查中文译词中是否存在作为句子元素的结果补语;如果存在,则特定句子元素的链接指针和辨别因子检查结果补语是否伴随着原始英语句子翻译出的中文动词;如果是,该模块在翻译出的中文动词后面紧接着插入结果补语的中文译词;第四特定翻译模块(504)通过特定句子元素的链接指针和辨别因子检查原始的英语句子结构是否是“be+过去分词”;如果是,该模块通过特定句子元素的链接指针和辨别因子检查原始英语句子翻译出的中文动词是否支配生物/事物的动作或对其产生影响;如果是,则将中文字“被”加在翻译出的中文动词前面;接下来,该模块通过特定句子元素的链接指针和辨别因子根据中文语法重新检查英语介词(其紧跟在英语动词后面)的中文译词——该中文译词是否适合翻译出的中文动词;因为英语介词的中文译词在中文语法中具有一些特殊的翻译状况;接下来,该模块根据中文语言的词序规则重新构造中文译词;第五特定翻译模块(505)通过特定句子元素的链接指针和辨别因子检查原始的英语句子是否是形容词短语句子;如果是,则该模块通过特定句子元素的链接指针和辨别因子删除原始英语单词“be”的中文译词,然后根据中文语言的词序规则重新构造中文译词;词库中的每个英语单词具有与词素单位(共同特征)、基本句子元素(共同特征)、调节性句子元素(独立特征)、特定句子元素(独立特征)相关的数据;尤其是特定句子元素在第一、第二、第三词典数据库中标有辨别因子;辨别因子检查英语单词中的特定句子元素的信息,并在特定翻译模块中通过特定句子元素的链接指针来激活;辨别因子和特定句子元素的链接指针将与其链接的英语单词指派给将原始英语句子翻译成正确、自然的中文译句的第一至第五特定翻译模块;词库的第一词典数据库存储了常见字词的信息;词库的第二、第三词典数据库存储了复合词、习惯用语、俗语的信息;第四词典数据库存储了术语的信息。
地址 韩国首尔