发明名称 基于主动学和多标签多示例学的场景图像标注方法
摘要 本发明针对场景图像的两个基本特征:(1)场景图像往往包含复杂语义;(2)人工标注大量的图像需要耗费昂贵人力成本,公开了一种基于主动学和多标签多示例学的场景图像标注方法,包括:在有标签图像基础上训练初始分类模型;对无标签图像进行标签预测;计算分类模型可信度;选择不确定性最大无标签图像;专家对该图像进行人工标注;更新图像集合;当算法达到要求时停止。本发明利用主动学策略,在保证分类模型精确度的同时,大大减少了需要人工标注的场景图像数量,从而降低了标注成本。同时,本发明把图像转化为多标签多示例数据,使图像复杂语义得到合理表示,提高了图像标注的精确度。
申请公布号 CN105117429A 申请公布日期 2015.12.02
申请号 CN201510473322.2 申请日期 2015.08.05
申请人 广东工业大学 发明人 肖燕珊;刘波;郝志峰;李杰龙;阮奕邦;张丽阳
分类号 G06F17/30(2006.01)I;G06K9/62(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 广州市深研专利事务所 44229 代理人 陈雅平
主权项 基于主动学习和多标签多示例学习的场景图像标注方法,其特征在于,包括如下步骤,第一步、获取一批无标签的场景图像;随机抽取少量场景图像,通过专家人工标注方式,赋予这些场景图像分类标签,分类标签的最大数目为k,k≥2,将原来的场景图像集合被重新分为两个集合,一个集合包含少量有标签场景图像,另外一个集合包括剩下的大量无标签场景图像;第二步、把有标签场景图像和无标签场景图像转化为多示例数据,每幅图像看作一个多示例包,每个区域看成多示例包的一个示例;第三步、把少量有标签场景图像看作训练集,根据场景图像的标签数量,训练若干个初始分类模型;第四步、利用已建立的分类模型,对样本集中的无标签场景图像进行标注,每个图像可能具有多个标签;第五步、根据无标签场景图像的标注结果,计算每个分类模型的可信度;第六步、结合分类模型的可信度,从无标签场景图像中挑选一个不确定性最大的图像,并交给专家对该场景图像进行标注;第七步、把经过专家标注的场景图像从无标签图像数据集中移除,放入有标签场景图像数据集,并重新训练分类模型;第八步、判断该模型的精确度是否达到用户所要求的精确度,或者迭代轮数是否达到用户指定的次数,如果没有达到要求则返回第三步;否则结束并输出分类模型。
地址 510006 广东省广州市大学城外环西路100号