发明名称 |
基于句法分析和层次模型的机器翻译系统和方法 |
摘要 |
本发明公开了一种基于句法分析和层次模型的机器翻译系统和方法,所述机器翻译系统包括词对齐模块、短语提取模块、词性句法标注模块、基于句法的非连续短语提取模块、基于非连续短语的翻译模块和评分输出模块。所述机器翻译系统和方法在通用的基于连续短语的机器翻译模型基础上进行句法分析,从而从双语句对齐文本中提取基于句法的非连续短语规则库,解决全句上下文非连续固定搭配的问题,使其符合语言的句法特征;基于非连续短语规则库和短语对齐表进行翻译,对翻译结果基于评估模型进行评分,从而有效地改善了翻译效果。 |
申请公布号 |
CN102214166A |
申请公布日期 |
2011.10.12 |
申请号 |
CN201010144623.8 |
申请日期 |
2010.04.06 |
申请人 |
三星电子(中国)研发中心;三星电子株式会社 |
发明人 |
熊张亮;何亮;万磊 |
分类号 |
G06F17/28(2006.01)I |
主分类号 |
G06F17/28(2006.01)I |
代理机构 |
北京铭硕知识产权代理有限公司 11286 |
代理人 |
王青芝;郭鸿禧 |
主权项 |
一种基于句法分析和层次模型的机器翻译系统,包括:词对齐模块,从外部接收双语句对齐文本,并从接收的双语对齐文本中获得词对齐信息;短语提取模块,从词对齐模块接收词对齐信息,利用接收的词对齐信息进行短语提取,以获得短语对齐表;词性句法标注模块,从外部接收已标注语料库和双语句对齐文本,从已标注语料库中提取有用的语言知识及其概率分布信息,并利用提取出的语言知识及其概率分布信息对双语句对齐文本中的双语或者单语进行词性及句法标注,产生句法标注语料库;基于句法的非连续短语提取模块,从词性句法标注模块接收句法标注语料库,并基于句法标注语料库根据词对齐模块产生的对齐信息或短语提取模块产生的短语对齐表进行基于句法的非连续短语提取,以产生基于句法的非连续短语规则库;基于非连续短语的翻译模块,从非连续短语提取模块接收基于句法的非连续短语规则库,并对待翻译句子在所述基于句法的非连续短语规则库中检索所有可能的短语、翻译及其概率,并输出翻译结果;评分输出模块,从外部接收评估模型,基于评估模型对翻译结果进行评分,并输出得分最高的翻译结果。 |
地址 |
210008 江苏省南京市中山路268号汇杰广场8楼 |