发明名称 词对齐方法和词对齐设备
摘要 本发明公开了词对齐方法和词对齐设备。根据本发明的词对齐方法用于将源语言和目标语言的双语句对中的源语言词语和目标语言词语对齐,该词对齐方法包括:将所述源语言词语和所述目标语言词语转换为源语言词向量和目标语言词向量;利用映射模型,确定与所述源语言词向量对应的参考目标语言词向量;计算所述参考目标语言词向量与所述目标语言词向量之间的相似度;以及将所计算的相似度作为特征,利用基于特征函数的词对齐模型,对齐所述源语言词语和所述目标语言词语。
申请公布号 CN105446958A 申请公布日期 2016.03.30
申请号 CN201410344476.7 申请日期 2014.07.18
申请人 富士通株式会社 发明人 李中华;夏迎炬;孙健
分类号 G06F17/28(2006.01)I 主分类号 G06F17/28(2006.01)I
代理机构 北京集佳知识产权代理有限公司 11227 代理人 康建峰;吴琼
主权项 一种词对齐方法,用于将源语言和目标语言的双语句对中的源语言词语和目标语言词语对齐,包括:将所述源语言词语和所述目标语言词语转换为源语言词向量和目标语言词向量;利用映射模型,确定与所述源语言词向量对应的参考目标语言词向量;计算所述参考目标语言词向量与所述目标语言词向量之间的相似度;以及将所计算的相似度作为特征,利用基于特征函数的词对齐模型,对齐所述源语言词语和所述目标语言词语。
地址 日本神奈川县