发明名称 汉语外语句型转换双向机器翻译方法
摘要 本发明是一种汉语与外语的双向机器翻译的方法,属于机器翻译技术领域。一方面翻译时由于汉语信息的表达采用仅用26个拉丁字母为码元的汉语语音码技术,使得汉语信息的表达与ASCII码100%兼容,另一方面由于采用源语言和目标语言基本相一致的词法和句法系统基础上的句型转换的方法,使得本机器翻译方法比传统的机器翻译方法翻译效果更准确更好。它极大方便对外汉语教学和外国人学汉语并能广泛应用于计算机及嵌入式机器翻译系统中。
申请公布号 CN101131689B 申请公布日期 2010.08.18
申请号 CN200610030284.4 申请日期 2006.08.22
申请人 苗玉水 发明人 苗玉水
分类号 G06F17/28(2006.01)I;G06F17/27(2006.01)I 主分类号 G06F17/28(2006.01)I
代理机构 代理人
主权项 一种汉语与外语的双向机器翻译的方法,采用汉语语音码,它是在建立源语言与目标语言基本相一致的词法句法基础上,通过汉语与外语双向句型转换,实现包括应用在各种计算机和嵌入式系统在内的汉语与外语的双向机器翻译的方法,其特征主要包括以下步骤:步骤A:(一)所采用的语音码的每一音节声、韵、调的编码方法采用类似以下的方法:注:括号内的符号均为汉语拼音符号,不带括号的字母为所采用的汉语每一音节声、韵、调的编码1、声码的编码:b:(b)       p:(p)   m:(m)       f:(f)    d:(d)       t:(t)n:(n)       l:(l)   g:(g)       k:(k)    h:(h)j:(zh)(j)            q:(ch),(q)           x:(sh),(x) r:(r)z:(z)       c:(c)   s:(s)       y:(y)    w:(w)2、介码的编码:i:(i)    u:(u)    y:(ü)3、韵码的编码:a:(a)     o:(o)     e:(e)       i:(i)      u:(u)     y:(ü)k:(ao)    c:(ai)    s:(an)      x:(ou)     w:(ei)    n:(en)z:(ua)    l:(uo)    b:(ang)     d:(ong)    p:(eng)q:(ing)   g:(ng)    (无声母韵母) er:(er)r:(i)[只与(zh)、(ch)、(sh)相拼]4、调码的编码:a:(-)阴平e:(/)阳平v:(∨)上声u:(/)去声o:(不标)轻声(二)利用上述编码的汉语信息全息表示采用如下的方法:以单词为单位,这里将单个汉字看作单音节词,根据组成该单词的每个音节的《汉语拼音方案》中的拼音,依次按“声码+介码+韵码+调码兼隔音节符号”的顺序编码,同一个单词的多个音节不用空格隔开连写,单词与单词之间的编码用空格隔开;步骤B:首先运用人工的方法建立同一种语言句子的词性串与句型的对应关系,然后再在建立汉语与需要翻译的外语基本相一致的词法系统和句法系统基础上,建立所需要翻译的两种语言间的句型对照关系,这里的词法就是关于词类的定义和划分以及研究单词、词形的变化及其用法,句法就是是关于句子成分的定义和划分以及研究句子种类、句子结构及其内部形式,句型就是句子内部各个单词、词组、短语、从句的词性或相当词性及其在句子中所担当成分的排列顺序及其形式;翻译时机器先扫描源语言的句子,通过查源语言标注词性的词典得到源语言的句子的词性串,通过查源语言词性串与源语言句型的对应关系表,将源语言的句子的词性串转换成对应的源语言句型,再通过查源语言句型与目标语言句型对照表,将源语言句型转换成匹配的目标语言句型,最后通过查源语言与目标语言对照词典的方法,将源语言中的单词或词组翻译成目标语言的单词或词组,并按目标语言句型的顺序以词为单位排列输出,便得到我们所需要的目标语言语句;对源语言中的复句先进行语法分析将复句中的所有从句提取出来,通过层层提取直到最后将从句提成单句为止,再按上述翻译单句的方式进行机器翻译,复句部分则通过查源语言和目标语言句型对照表完成复句句型转换,并完成除从句的复句其它成分的翻译,最后将翻译好的从句放入转换后相应复句句型中的相应位置,如此循环往复一直到得到我们所需要的整个目标语言句子为止。
地址 200093 上海市杨浦区控江一村44号甲105室