发明名称 | 一种双语语义关系分类模型的建立方法和系统 | ||
摘要 | 本发明公开一种双语语义关系分类模型的建立方法及系统。所述方法包括:通过第一语言分类器对未标注语义关系的对应于第一语言的第一未标注语料进行语义关系分类,得到语义关系分类结果;将所述第一未标注语料翻译为对应于第二语言的第二未标注语料;保存所述第一未标注语料与所述语义关系分类结果的对应关系至所述第一语言分类器的第一训练集;保存所述第二未标注语料与所述语义关系分类结果的对应关系至第二语言分类器的第二训练集。采用本发明的方法或系统,可以减少对大规模训练语料的需求,提高双语语义关系分类模型的建立效率。 | ||
申请公布号 | CN103559181A | 申请公布日期 | 2014.02.05 |
申请号 | CN201310572760.5 | 申请日期 | 2013.11.14 |
申请人 | 苏州大学 | 发明人 | 钱龙华;胡亚楠;周国栋 |
分类号 | G06F17/28(2006.01)I | 主分类号 | G06F17/28(2006.01)I |
代理机构 | 北京集佳知识产权代理有限公司 11227 | 代理人 | 王宝筠 |
主权项 | 一种双语语义关系分类模型的建立方法,其特征在于,所述方法包括:通过第一语言分类器对未标注语义关系的对应于第一语言的第一未标注语料进行语义关系分类,得到第一语义关系分类结果;保存所述第一未标注语料与所述第一语义关系分类结果的对应关系至所述第一语言分类器的第一训练集;将所述第一未标注语料翻译为对应于第二语言的第二未标注语料;保存所述第二未标注语料与所述第一语义关系分类结果的对应关系至第二语言分类器的第二训练集;通过所述第二语言分类器对未标注语义关系的对应于所述第二语言的第三未标注语料进行语义关系分类,得到第二语义关系分类结果;保存所述第三未标注语料与所述第二语义关系分类结果的对应关系至所述第二训练集;将所述第三未标注语料翻译为对应于所述第一语言的第四未标注语料;保存所述第四未标注语料与所述第二语义关系分类结果的对应关系至所述第一训练集。 | ||
地址 | 215123 江苏省苏州市工业园区仁爱路199号 |