发明名称 一种基于跨类别迁移主动学的图像分类方法
摘要 本发明公开了一种基于跨类别迁移主动学的图像分类方法,包括如下步骤:对辅助类别数据与目标类别数据中的图像进行向量化特征表示;构建辅助类别属性表示和目标类别属性表示;构造目标函数;优化求解目标函数,得到生成函数;利用生成函数及目标类别属性表示得到分类模型;利用分类模型计算目标类别数据中所有无标注图像的不确定性;选取不确定性最大的无标注图像进行标注;对目标类别数据中图像的权重进行更新,重新构造目标函数。本发明能够有效地在目标类别数据中挑选最有信息量的图像样本进行标注,有助于在目标类别只有极少有标注数据的情况下训练出准确的分类模型,降低标注成本。
申请公布号 CN105701509A 申请公布日期 2016.06.22
申请号 CN201610021429.8 申请日期 2016.01.13
申请人 清华大学;北京恒冠网络数据处理有限公司 发明人 丁贵广;郭雨晨;李长青;孙鹏
分类号 G06K9/62(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 北京恒冠智创知识产权代理有限公司 11543 代理人 石友华
主权项 一种基于跨类别迁移主动学习的图像分类方法,其特征在于,包括如下步骤:步骤S1:利用特征抽取工具分别对辅助类别数据中的图像与目标类别数据中的有标注图像和无标注图像进行向量化特征表示,得到辅助类别图像特征向量和目标类别图像特征向量;步骤S2:分别针对辅助类别数据和目标类别数据构建出辅助类别属性表示和目标类别属性表示;步骤S3:利用步骤S1中得到的辅助类别图像特征向量和目标类别图像特征向量,以及步骤S2中得到的辅助类别属性表示和目标类别属性表示构造目标函数;步骤S4:利用迭代式的优化方法求解上一步得到的目标函数,并得到生成函数;步骤S5:利用上一步得到的生成函数以及步骤S2中得到的目标类别属性表示,直接产生各个目标类别对应的分类模型;步骤S6:判断步骤S5中得到的分类模型的准确性是否符合要求,如果符合结束本次学习,如果不符合转下一步;步骤S7:利用步骤S5中得到的分类模型,计算目标类别数据中所有无标注图像的不确定性,并按不确定性从大到小进行排序;步骤S8:选取上一步中不确定性最大的无标注图像进行标注,将无标注图像转化为有标注图像;步骤S9:对目标类别数据中图像的权重进行更新;然后转步骤S3。
地址 100084 北京市海淀区清华园清华大学