发明名称 基于主动学的分类器样本选择方法及其装置
摘要 本发明公开一种基于主动学的分类器样本选择方法及其装置,以敏感性为基准,通过挑选敏感性大的样本点,来寻找在其周围变化剧烈的样本点,这些样本点往往对训练分类器是重要的。本发明可以有效减少需要标记样本点的数量,减少标记的代价并提高分类器的性能。
申请公布号 CN103679269A 申请公布日期 2014.03.26
申请号 CN201310654384.4 申请日期 2013.12.05
申请人 河海大学 发明人 储荣
分类号 G06N3/08(2006.01)I 主分类号 G06N3/08(2006.01)I
代理机构 南京苏高专利商标事务所(普通合伙) 32204 代理人 李玉平
主权项 一种基于主动学习的分类器样本选择方法,其特征在于,包括以下步骤:1)从未经标记的训练样本中随机选取一小部分样本进行标记以形成训练样本集;2)利用训练样本集训练分类器,得到经过训练的分类器;3)计算未经标记的样本在已有分类器下的敏感性,利用敏感性得到一批在已有分类器中比较敏感的样本;4)将所得比较敏感的样本加入到已有训练样本集中,得到新的训练样本集,并利用新的训练样本集训练分类器,得到新的分类器;5)利用测试样本集对步骤4)得到的新的分类器进行测试,若测试结果满足用户要求则结束样本选择,若所述测试结果不满足用户要求则回到步骤3),重复步骤3)~5),直到分类器性能达到要求为止。
地址 210098 江苏省南京市西康路1号