发明名称 一种基于谓词论元结构的统计机器翻译方法
摘要 本发明涉及一种基于谓词论元结构的统计机器翻译方法,所述方法包括如下步骤:对双语语料中的双语句子对进行分词、自动词对齐、句法分析以及双语联合语义角色标注;根据所述双语联合语义角色标注的结果,抽取所述双语句子对的PAS转换规则,以对两种语言的谓词论元结构之间的关系进行建模;利用所述PAS转换规则,匹配待翻译句子的多个语义角色标注结果,并相应进行翻译;根据所述PAS转换规则的匹配和翻译结果,构造翻译超图,最终生成翻译结果。
申请公布号 CN103020045B 申请公布日期 2015.05.13
申请号 CN201210534093.7 申请日期 2012.12.11
申请人 中国科学院自动化研究所 发明人 宗成庆;翟飞飞;张家俊;周玉
分类号 G06F17/28(2006.01)I;G06F17/27(2006.01)I 主分类号 G06F17/28(2006.01)I
代理机构 中科专利商标代理有限责任公司 11021 代理人 宋焰琴
主权项 基于谓词论元结构的统计机器翻译方法,其特征在于包括如下步骤:步骤1:基于谓词论元结构对双语语料中的双语句子对进行分词、自动词对齐、句法分析以及双语联合语义角色标注;步骤2:根据所述双语联合语义角色标注的结果,抽取所述双语句子对的PAS转换规则,以对两种语言的谓词论元结构之间的关系进行建模;步骤3:利用所述PAS转换规则,使用基于CKY模式的解码算法,匹配待翻译句子的多个语义角色标注结果,并相应进行翻译;步骤4:根据所述PAS转换规则的匹配和翻译结果,构造翻译超图,最终生成翻译结果;其中,抽取PAS转换规则的具体步骤如下:步骤21:首先利用自动词对齐的结果对双语联合语义角色标注的结果进行修正,以确定双语谓词论元结构的对应关系;步骤22:根据双语谓词论元结构的对应关系,抽取PAS转换规则;步骤23:根据所获得的PAS转换规则,对这些规则进行泛化扩展。
地址 100190 北京市海淀区中关村东路95号