发明名称 |
语料标注方法及设备 |
摘要 |
本发明提供一种语料标注方法及设备,所述方法包括:获取语料,获取至少两个标注终端对所述语料的标注信息,所述至少两个标注终端对所述语料的标注信息为所述至少两个标注终端收集的用户对所述语料的标注信息,如果所述至少两个标注终端对所述语料的标注信息一致,则获取参考终端对所述语料的标注信息,根据参考终端对所述语料的标注信息及所述至少两个标注终端对所述语料的标注信息,确定所述语料的标注结果,如果所述至少两个标注终端对所述语料的标注信息不一致,则获取所述审核终端对所述语料的标注信息,并将所述审核终端对所述语料的标注信息作为所述语料的标注结果。本发明实施例能够提高语料标注准确度同时兼顾标注效率。 |
申请公布号 |
CN103530282A |
申请公布日期 |
2014.01.22 |
申请号 |
CN201310504852.X |
申请日期 |
2013.10.23 |
申请人 |
北京紫冬锐意语音科技有限公司 |
发明人 |
高鹏 |
分类号 |
G06F17/27(2006.01)I;G06F17/30(2006.01)I |
主分类号 |
G06F17/27(2006.01)I |
代理机构 |
北京路浩知识产权代理有限公司 11002 |
代理人 |
李相雨 |
主权项 |
一种语料标注方法,其特征在于,包括:获取语料;获取至少两个标注终端对所述语料的标注信息,所述至少两个标注终端对所述语料的标注信息为所述至少两个标注终端收集的用户对所述语料的标注信息;如果所述至少两个标注终端对所述语料的标注信息一致,则获取参考终端对所述语料的标注信息,根据参考终端对所述语料的标注信息及所述至少两个标注终端对所述语料的标注信息,确定所述语料的标注结果;如果所述至少两个标注终端对所述语料的标注信息不一致,则获取审核终端对所述语料的标注信息,并将所述审核终端对所述语料的标注信息作为所述语料的标注结果。 |
地址 |
100191 北京市海淀区学院路35号世宁大厦409 |