发明名称 |
一种个性化的机器翻译系统、方法及训练翻译模型的方法 |
摘要 |
本发明提供了一种个性化的机器翻译系统、方法及训练翻译模型的方法,所述系统包括:第一输入模块;第一训练模块;通用翻译模型,用于描述无用户翻译偏好的源语言句子到目标语言句子的翻译概率;第二输入模块;第二训练模块;用户翻译模型,用于描述有用户翻译偏好的源语言句子到目标语言句子的翻译概率;用户识别模块;第三输入模块;翻译模块,用于使用所述通用翻译模型和所述匹配的用户翻译模型对所述待翻译信息进行翻译,以得到翻译结果。上述机器翻译系统,可以很好地针对不同用户输入的相同信息,给出符合用户翻译偏好的翻译结果。 |
申请公布号 |
CN102789451B |
申请公布日期 |
2015.06.03 |
申请号 |
CN201110126415.X |
申请日期 |
2011.05.16 |
申请人 |
北京百度网讯科技有限公司 |
发明人 |
胡晓光;吴华 |
分类号 |
G06F17/28(2006.01)I |
主分类号 |
G06F17/28(2006.01)I |
代理机构 |
北京鸿德海业知识产权代理事务所(普通合伙) 11412 |
代理人 |
袁媛 |
主权项 |
一种个性化的机器翻译系统,其特征在于,所述系统包括:第一输入模块,用于从所述系统外部获取第一双语语料,其中所述第一双语语料为大规模双语语料,所述双语语料包括由具有互译关系的源语言句子和目标语言句子组成的双语句对;第一训练模块,用于根据所述第一双语语料,训练通用翻译模型;所述通用翻译模型,用于描述无用户翻译偏好的源语言句子到目标语言句子的翻译概率;第二输入模块,用于从所述系统外部获取第二双语语料,所述第二双语语料为用户提交的双语语料;第二训练模块,用于根据所述第二双语语料,训练用户翻译模型;所述用户翻译模型,用于描述有用户翻译偏好的源语言句子到目标语言句子的翻译概率;用户识别模块,用于获取当前用户信息,并根据所述当前用户信息获取所述当前用户和所述用户翻译模型之间的关联关系,并通过所述关联关系选择与所述当前用户匹配的用户翻译模型;第三输入模块,用于从所述系统外部获取所述当前用户输入的待翻译信息;翻译模块,用于使用所述通用翻译模型和所述匹配的用户翻译模型对所述待翻译信息进行翻译,以得到翻译结果。 |
地址 |
100085 北京市海淀区上地十街10号百度大厦2层 |