发明名称 | 翻译信息的方法和装置 | ||
摘要 | 本发明公开了一种翻译信息的方法和装置,属于自然语言处理研究领域。方法包括:获取源语言格式的第一信息中包含的表情符号;在第一信息中将该表情符号置换为用于标识该表情符号的第一标识得到第二信息;将第二信息翻译为目标语言格式的第三信息;从第三信息中提取与第一标识相对应的第二标识;在第三信息中将第二标识置换为第二标识对应的表情符号得到第四信息。装置包括:第一获取模块,第一置换模块,翻译模块,第一提取模块和第二置换模块。实现了不受表情符号库及翻译词典的限制,对表情符号的高精度翻译,降低构筑包含表情符号的翻译词典、翻译规则、翻译模型和语言模型等成本,解决表情符号词典内未登录的表情符号的识别、翻译和生成问题。 | ||
申请公布号 | CN104699675A | 申请公布日期 | 2015.06.10 |
申请号 | CN201510119654.0 | 申请日期 | 2015.03.18 |
申请人 | 北京交通大学 | 发明人 | 徐金安;赵雁榕;韩晓光;肖冰;徐凡;陈钰枫 |
分类号 | G06F17/28(2006.01)I | 主分类号 | G06F17/28(2006.01)I |
代理机构 | 北京三高永信知识产权代理有限责任公司 11138 | 代理人 | 滕一斌 |
主权项 | 一种翻译信息的方法,其特征在于,所述方法包括:获取源语言格式的第一信息中包含的表情符号;在所述第一信息中将所述表情符号置换为用于标识所述表情符号的第一标识得到第二信息;将所述第二信息翻译为目标语言格式的第三信息;从所述第三信息中提取与所述第一标识相对应的第二标识;在所述第三信息中将所述第二标识置换为所述第二标识对应的表情符号得到第四信息。 | ||
地址 | 100044 北京市海淀区上园村3号 |