发明名称 用于计算机辅助翻译的候选短语查询方法及辅助翻译系统
摘要 本发明提供了计算机辅助翻译的方法及系统,在机器翻译结果的基础上,利用机器翻译中的中间信息、用户记忆库、词典等其他方面的辅助翻译信息来修改和完善机器自动翻译的结果。其中,采用基于AC自动机的候选短语查询方法,在线性复杂度之内解决了候选短语的查询问题,大大提高了辅助翻译的效率;采用基于卡尔曼滤波的候选短语排序方法解决了不同集合的短语之间的排序问题,通过用户翻译历史记录的分析,不断优化各候选短语集合的权重,从而提高候选短语推荐的精准度。
申请公布号 CN102693309B 申请公布日期 2014.08.06
申请号 CN201210166934.3 申请日期 2012.05.25
申请人 中国科学院计算技术研究所 发明人 刘群;王洋;刘洋;骆卫华;吕雅娟
分类号 G06F17/30(2006.01)I;G06F17/28(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京泛华伟业知识产权代理有限公司 11280 代理人 王勇
主权项 一种用于计算机辅助翻译的候选短语查询方法,所述方法包括:接收源语言句子;然后从候选短语集合的Trie树查找出所有与源语言句子相关的候选短语;其中,所述Trie树的每个节点都具有失败指针,所述失败指针是通过以下的步骤构造的:步骤(1)将所述Trie树的根节点和第一层节点的失败指针都指向根节点;步骤(2)对整棵Trie树进行广度优先遍历,对于任意一个当前节点,如果通过某一条件使得当前节点及当前节点的某一子节点,以及当前节点的失败指针所指向的节点及该当前节点的失败指针所指向的节点的子节点都有相同的状态转移,则当前节点的子节点的失败指针指向所述当前节点的失败指针所指向的节点的子节点,否则指向根节点。
地址 100190 北京市海淀区中关村科学院南路6号