发明名称 |
基于统计的机器翻译方法、装置及电子设备 |
摘要 |
本发明公开了一种基于统计的机器翻译方法、装置及电子设备,一种计算语义相似度的方法、装置和电子设备,以及一种词量化方法、装置和电子设备。其中所述基于统计的机器翻译方法,通过根据各个候选译文的对翻译概率产生影响的特征,以及预先生成的翻译概率预测模型,生成待翻译句子到各个候选译文的翻译概率,其中所述对翻译概率产生影响的特征至少包括所述待翻译句子和所述候选译文的语义相似度,并选取预设数量的翻译概率排在高位的候选译文,作为待翻译句子的译文。采用本申请提供的基于统计的机器翻译方法,能够在构建机器翻译模型时深入到自然语言的语义层面,避免译文与原文的语义有偏差,从而达到提高翻译质量的效果。 |
申请公布号 |
CN106484682A |
申请公布日期 |
2017.03.08 |
申请号 |
CN201510527745.8 |
申请日期 |
2015.08.25 |
申请人 |
阿里巴巴集团控股有限公司 |
发明人 |
曾晓东;骆卫华;林锋 |
分类号 |
G06F17/28(2006.01)I;G06N3/02(2006.01)I |
主分类号 |
G06F17/28(2006.01)I |
代理机构 |
北京市清华源律师事务所 11441 |
代理人 |
沈泳;李赞坚 |
主权项 |
一种基于统计的机器翻译方法,其特征在于,包括:根据预先生成的翻译规则,对待翻译句子进行解码,生成所述待翻译句子的候选译文;根据各个候选译文的对翻译概率产生影响的特征,以及预先生成的翻译概率预测模型,生成所述待翻译句子到各个候选译文的翻译概率;所述对翻译概率产生影响的特征至少包括所述待翻译句子和所述候选译文的语义相似度;选取预设数量的所述翻译概率排在高位的候选译文,作为所述待翻译句子的译文。 |
地址 |
英属开曼群岛大开曼资本大厦一座四层847号邮箱 |