发明名称 一种基于协同学的概念识别方法及装置
摘要 本发明公开了一种基于协同学的概念识别方法及装置,用以提高概念识别质量,尤其是提高基于部分标记的训练数据构建序列分类器进行概念识别时的质量。该方法为:将训练数据集划分为至少两个子集,所述训练数据集中包含的训练数据为带标记词的文本文档;基于子集包含的训练数据以及根据所述训练数据集提取的特征词集合进行协同学,构建至少两个序列分类器;采用获得的各序列分类器分别对当前文本文档进行概念识别,并根据每个序列分类器识别出的概念确定所述当前文本文档包含的概念。
申请公布号 CN103324632A 申请公布日期 2013.09.25
申请号 CN201210077906.4 申请日期 2012.03.22
申请人 日电(中国)有限公司 发明人 李建强;陈宽桐;刘春辰
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京同达信恒知识产权代理有限公司 11291 代理人 孔凡红
主权项 一种基于协同学习的概念识别方法,其特征在于,包括:将训练数据集划分为至少两个子集,所述训练数据集中包含的训练数据为带标记词的文本文档;基于子集包含的训练数据以及根据所述训练数据集提取的特征词集合进行协同学习,构建至少两个序列分类器;采用获得的各序列分类器分别对当前文本文档进行概念识别,并根据每个序列分类器识别出的概念确定所述当前文本文档包含的概念。
地址 100191 北京市海淀区学院路35号世宁大厦20层