基于主动学和多标签多示例学的场景图像标注方法,申请号CN201510473322.2-传众专利搜索

发明名称	基于主动学和多标签多示例学的场景图像标注方法
摘要	本发明针对场景图像的两个基本特征：（1）场景图像往往包含复杂语义；（2）人工标注大量的图像需要耗费昂贵人力成本，公开了一种基于主动学和多标签多示例学的场景图像标注方法，包括：在有标签图像基础上训练初始分类模型；对无标签图像进行标签预测；计算分类模型可信度；选择不确定性最大无标签图像；专家对该图像进行人工标注；更新图像集合；当算法达到要求时停止。本发明利用主动学策略，在保证分类模型精确度的同时，大大减少了需要人工标注的场景图像数量，从而降低了标注成本。同时，本发明把图像转化为多标签多示例数据，使图像复杂语义得到合理表示，提高了图像标注的精确度。
申请公布号	CN105117429A	申请公布日期	2015.12.02
申请号	CN201510473322.2	申请日期	2015.08.05
申请人	广东工业大学	发明人	肖燕珊;刘波;郝志峰;李杰龙;阮奕邦;张丽阳
分类号	G06F17/30(2006.01)I;G06K9/62(2006.01)I	主分类号	G06F17/30(2006.01)I
代理机构	广州市深研专利事务所 44229	代理人	陈雅平
主权项	基于主动学习和多标签多示例学习的场景图像标注方法，其特征在于，包括如下步骤，第一步、获取一批无标签的场景图像；随机抽取少量场景图像，通过专家人工标注方式，赋予这些场景图像分类标签，分类标签的最大数目为k，k≥2，将原来的场景图像集合被重新分为两个集合，一个集合包含少量有标签场景图像，另外一个集合包括剩下的大量无标签场景图像；第二步、把有标签场景图像和无标签场景图像转化为多示例数据，每幅图像看作一个多示例包，每个区域看成多示例包的一个示例；第三步、把少量有标签场景图像看作训练集，根据场景图像的标签数量，训练若干个初始分类模型；第四步、利用已建立的分类模型，对样本集中的无标签场景图像进行标注，每个图像可能具有多个标签；第五步、根据无标签场景图像的标注结果，计算每个分类模型的可信度；第六步、结合分类模型的可信度，从无标签场景图像中挑选一个不确定性最大的图像，并交给专家对该场景图像进行标注；第七步、把经过专家标注的场景图像从无标签图像数据集中移除，放入有标签场景图像数据集，并重新训练分类模型；第八步、判断该模型的精确度是否达到用户所要求的精确度，或者迭代轮数是否达到用户指定的次数，如果没有达到要求则返回第三步；否则结束并输出分类模型。
地址	510006 广东省广州市大学城外环西路100号