发明名称 一种双语段落对齐算法
摘要 本发明申请以堆双语语料库进行语段级对齐是基于实例的机器翻译(EBMT)的基础,提出了基于锚词对的英汉双语语段对齐模型并给出了相应的对齐算法,解决了中、小规模语料库的数据稀疏问题。系统把语段切分的歧义推迟到语段对齐时排除,提高了语段切分的正确率。
申请公布号 CN101520776A 申请公布日期 2009.09.02
申请号 CN200810033961.7 申请日期 2008.02.28
申请人 刘建 发明人 刘建
分类号 G06F17/28(2006.01)I 主分类号 G06F17/28(2006.01)I
代理机构 代理人
主权项 1. 本专利申请中提出的为平滑参数而提出的“词形语段”的概念。
地址 200240上海市闵行区东川路800号南区15楼