发明名称 |
机器翻译方法及系统 |
摘要 |
本发明公开了一种机器翻译方法及系统,属于自然语言处理研究领域。所述方法包括:获取源语言测试句子;分别得到词法分析结果和句法分析结果;利用句法分析结果,抽取谓词论元结构;根据目标语言的句法特点,将谓词论元结构进行结构转换;利用转换后的谓词论元结构和训练得到的翻译规则,对源语言测试句子进行翻译。通过利用句子结构信息和谓词论元结构的语义信息,使用源语言端的句法分析结果,通过谓词论元结构转换处理,实现基于谓词论元结构转换的统计机器翻译;解决了现有技术中翻译规则的冗余规则数量非常大,从而致使机器翻译性能非常差的问题;达到了可有效地改善句子结构的全局调序性能,减少抽取翻译规则数量,提高翻译质量的效果。 |
申请公布号 |
CN104268132A |
申请公布日期 |
2015.01.07 |
申请号 |
CN201410461325.X |
申请日期 |
2014.09.11 |
申请人 |
北京交通大学 |
发明人 |
徐金安;刘江鸣;吴培昊 |
分类号 |
G06F17/28(2006.01)I;G06F17/27(2006.01)I |
主分类号 |
G06F17/28(2006.01)I |
代理机构 |
北京三高永信知识产权代理有限责任公司 11138 |
代理人 |
滕一斌 |
主权项 |
一种机器翻译方法,其特征在于,所述方法包括翻译步骤,所述翻译步骤包括:获取输入的源语言测试句子;对所述源语言测试句子进行词法分析,得到所述源语言测试句子的词法分析结果;对所述源语言测试句子的词法分析结果进行句法结构分析,得到所述源语言测试句子的句法分析结果;利用所述源语言测试句子的句法分析结果,抽取所述源语言测试句子的谓词论元结构;根据目标语言的句法特点,将所述谓词论元结构进行结构转换,得到符合所述目标语言的句法特点的谓词论元结构;利用转换后的所述谓词论元结构和翻译规则库中训练得到的翻译规则以及建立的目标语言模型,对所述源语言测试句子进行翻译,输出语言为所述目标语言的翻译结果。 |
地址 |
100044 北京市海淀区上园村3号 |