发明名称 训练语料扩充装置和训练语料扩充方法
摘要 本发明提供了一种训练语料扩充装置,包括:筛选单元,根据预设的语料筛选条件筛选出初始语料样本;扩充单元,按照所述初始语料样本和扩充策略对被收集的语料进行标识,得到扩充语料样本,以及基于所述扩充语料样本和所述扩充策略再次进行语料扩充。相应地,本发明还提供了一种训练语料扩充方法,通过本发明的技术方案,可以通过自动化的方式对大规模的训练语料进行机器标注,从而大大节省制作大规模训练语料的时间周期和成本,并且可提高标注准确率。
申请公布号 CN104346406A 申请公布日期 2015.02.11
申请号 CN201310344326.1 申请日期 2013.08.08
申请人 北大方正集团有限公司;北京方正阿帕比技术有限公司 发明人 赫亮;董宁;叶茂
分类号 G06F17/30(2006.01)I;G06F17/27(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京友联知识产权代理事务所(普通合伙) 11343 代理人 尚志峰;汪海屏
主权项 一种训练语料扩充装置,其特征在于,包括:筛选单元,根据预设的语料筛选条件筛选出初始语料样本;扩充单元,按照所述初始语料样本和扩充策略对被收集的语料进行标识,得到扩充语料样本,以及基于所述扩充语料样本和所述扩充策略再次进行语料扩充。
地址 100871 北京市海淀区成府路298号方正大厦9层