发明名称 | 一种面向形态丰富语言的翻译方法和系统 | ||
摘要 | 一种面向形态丰富语言的翻译方法和系统,所述方法包括:步骤1,对形态丰富语言进行形态分析,获得词干和词缀信息;步骤2,在抽取翻译规则时,以词干作为原子翻译单元,并保留相应的词缀分布信息;步骤3,在翻译时,对于待翻译的片段,获取其词干、词缀分布;词干序列用来查询规则表,词缀分布信息和规则候选的词缀分布计算相似度,表征两者的相似程度,指导解码,所述词干序列是由多个词干组成的序列。 | ||
申请公布号 | CN102681985A | 申请公布日期 | 2012.09.19 |
申请号 | CN201210152487.6 | 申请日期 | 2012.05.16 |
申请人 | 中国科学院计算技术研究所 | 发明人 | 王志洋;吕雅娟;刘群 |
分类号 | G06F17/28(2006.01)I | 主分类号 | G06F17/28(2006.01)I |
代理机构 | 北京律诚同业知识产权代理有限公司 11006 | 代理人 | 梁挥;祁建国 |
主权项 | 一种面向形态丰富语言的翻译方法,其特征在于,包括:步骤1,对形态丰富语言进行形态分析,获得词干和词缀信息;步骤2,在抽取翻译规则时,以词干作为原子翻译单元,并保留相应的词缀分布信息;步骤3,在翻译时,对于待翻译的片段,获取其词干、词缀分布;词干序列用来查询规则表,词缀分布信息和规则候选的词缀分布计算相似度,表征两者的相似程度,指导解码,所述词干序列是由多个词干组成的序列。 | ||
地址 | 100190 北京市海淀区中关村科学院南路6号 |