发明名称 基于主动学和半监督学的多类图像分类方法
摘要 本发明涉及图像信息处理技术领域,尤其涉及一种基于主动学和半监督学的多类图像分类方法。本发明包括初始样本选择及分类器模型训练、BvSB主动学样本选择、CST半监督学、训练样本集及分类器模型更新、分类过程迭代五个步骤。本发明通过执行BvSB主动学样本选择、CST半监督学和SVM分类三方面的操作,使其在较小的人工标注情况下具有高效的图像分类效果,不会增加过多的计算负担,能够快速提供分类结果,兼顾了分类系统对计算复杂度的要求。
申请公布号 CN101853400B 申请公布日期 2012.09.26
申请号 CN201010184378.3 申请日期 2010.05.20
申请人 武汉大学 发明人 曹永锋;陈荣;殷慧
分类号 G06K9/66(2006.01)I 主分类号 G06K9/66(2006.01)I
代理机构 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 代理人 张火春
主权项 一种基于主动学习和半监督学习的多类图像分类方法,其特征在于,包括以下步骤:①初始样本选择及分类器模型训练:从未标注样本集中随机选择一部分图像进行人工标注,以这一部分带有类别标号信息的样本作为训练样本,训练支持向量机分类器的分类模型;②基于最优标号和次优标号的主动学习样本选择:根据支持向量机分类器的分类模型,利用基于最优标号和次优标号的主动学习准则选择分类不确定性最高的一部分样本,由用户对这一部分样本进行人工标注;实现方式如下,根据当前的SVM分类器的分类模型,计算未标注样本集的样本属于每个可能的类别的概率p(yi|x),Y={yi,i=1,...,k}为所有可能的类别标号集合,x对应的所有p(yi|x)的最大值为其最优标号的概率p(yBest|x),第二大的值为其次优标号的概率p(ySecond‑Best|x),BvSB主动学习样本选择准则表示为如下形式: <mrow> <mi>BvS</mi> <msup> <mi>B</mi> <mo>*</mo> </msup> <mo>=</mo> <munder> <mrow> <mi>arg</mi> <mi>min</mi> </mrow> <mrow> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>&Element;</mo> <mi>U</mi> </mrow> </munder> <mrow> <mo>(</mo> <mi>p</mi> <mrow> <mo>(</mo> <msub> <mi>y</mi> <mi>Best</mi> </msub> <mo>|</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mi>p</mi> <mrow> <mo>(</mo> <msub> <mi>y</mi> <mrow> <mi>Second</mi> <mo>-</mo> <mi>Best</mi> </mrow> </msub> <mo>|</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>10</mn> <mo>)</mo> </mrow> </mrow>其中U为未标注样本集;选择KBvSB个差值最小的样本,并由用户对其进行人工标注;③带约束条件的自训练半监督学习:对图像集中剩余的未标注样本,根据当前的分类器模型计算其最优标号的概率,并计算其余训练样本集中所有由用户人工标注的样本之间的距离,通过带约束条件的自训练半监督学习选择一部分样本,将这一部分样本的最优标号作为其类别标号;④训练样本集及分类器模型更新:将步骤②和步骤③中选出的样本,连同已经获得的类别标号,加入到当前训练样本集,对训练样本集进行更新,用更新后的训练样本集重新训练支持向量机分类器模型;⑤分类过程迭代:利用步骤④中所得支持向量机的分类模型,对测试图像集中的图像的类别标号进行预测,对输出分类结果进行迭代,直到测试图像集上的分类准确率满足分类精度要求。
地址 430072 湖北省武汉市武昌珞珈山