发明名称 基于改进的Nivre算法构建越南语依存树库的方法
摘要 本发明涉及基于改进的Nivre算法构建越南语依存树库的方法,属自然语言处理技术领域。本发明首先构建初始训练语料、扩展语料和测试语料;然后利用构建的初始训练语料基于改进的Nivre算法训练出两个依存分析弱学器S1和S2作为两个充分冗余的视图;再利用训练出的两个弱学器S1和S2对扩展语料进行依存分析并构建越南语依存树库模型;最后对测试语料进行依存分析测试并最终构建出越南语依存树库。本发明能够对越南语的句法分析、机器翻译和信息获取等上层应用提供有力支撑;能有效避免了人工标记越南语句子依存关系的过程,节省了人力物力的时间;能够有效利用大量无标记的越南语句子级语料提升依存分析的准确率。
申请公布号 CN106250367A 申请公布日期 2016.12.21
申请号 CN201610599528.4 申请日期 2016.07.27
申请人 昆明理工大学 发明人 余正涛;邱国柯;郭剑毅;文永华;王红斌;陈玮
分类号 G06F17/27(2006.01)I;G06F17/30(2006.01)I 主分类号 G06F17/27(2006.01)I
代理机构 代理人
主权项 基于改进的Nivre算法构建越南语依存树库的方法,其特征在于:所述基于改进的Nivre算法构建越南语依存树库的方法的具体步骤如下:Step1、首先构建初始训练语料、扩展语料和测试语料;Step2、然后利用构建的初始训练语料基于改进的Nivre算法训练出两个依存分析弱学习器S1和S2作为两个充分冗余的视图;Step3、再利用训练出的两个弱学习器S1和S2对扩展语料进行依存分析并构建越南语依存树库模型;Step4、最后利用构建的越南语依存树库模型对测试语料进行依存分析测试并最终构建出越南语依存树库。
地址 650093 云南省昆明市五华区学府路253号