发明名称 |
训练语料扩充装置和训练语料扩充方法 |
摘要 |
本发明提供了一种训练语料扩充装置,包括:筛选单元,根据预设的语料筛选条件筛选出初始语料样本;扩充单元,按照所述初始语料样本和扩充策略对被收集的语料进行标识,得到扩充语料样本,以及基于所述扩充语料样本和所述扩充策略再次进行语料扩充。相应地,本发明还提供了一种训练语料扩充方法,通过本发明的技术方案,可以通过自动化的方式对大规模的训练语料进行机器标注,从而大大节省制作大规模训练语料的时间周期和成本,并且可提高标注准确率。 |
申请公布号 |
CN104346406A |
申请公布日期 |
2015.02.11 |
申请号 |
CN201310344326.1 |
申请日期 |
2013.08.08 |
申请人 |
北大方正集团有限公司;北京方正阿帕比技术有限公司 |
发明人 |
赫亮;董宁;叶茂 |
分类号 |
G06F17/30(2006.01)I;G06F17/27(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京友联知识产权代理事务所(普通合伙) 11343 |
代理人 |
尚志峰;汪海屏 |
主权项 |
一种训练语料扩充装置,其特征在于,包括:筛选单元,根据预设的语料筛选条件筛选出初始语料样本;扩充单元,按照所述初始语料样本和扩充策略对被收集的语料进行标识,得到扩充语料样本,以及基于所述扩充语料样本和所述扩充策略再次进行语料扩充。 |
地址 |
100871 北京市海淀区成府路298号方正大厦9层 |