发明名称 一种基于多视图和半监督学机制的图像标注方法
摘要 本发明公开了一种基于多视图和半监督学机制的图像标注方法,该方法包括以下步骤:基于不相关视觉特征的多视图分类器学过程;基于标记样本和具有较高可信度伪标记样本的多视图分类器优化过程;基于最大熵投票原则和标注间相关性的多视图标注过程。本发明提出多视图半监督图像标注方法的性能明显优于之前提出的其它方案的性能,该方法的主要思想是:首先利用互不相关的视图来训练多个独立的分类器,然后利用初始标记样本和伪标记样本对视图分类器进行优化,最后基于最大熵投票原则以及各个标注间的相关性,为每幅未标记图像分配合适的语义标注。
申请公布号 CN103955462B 申请公布日期 2017.03.15
申请号 CN201410108060.5 申请日期 2014.03.21
申请人 南京邮电大学 发明人 朱松豪;陈玲玲;李向向
分类号 G06F17/30(2006.01)I;G06K9/66(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 南京知识律师事务所 32207 代理人 汪旭东
主权项 一种基于多视图和半监督学习机制的图像标注方法,其特征在于,包括以下步骤:步骤1:基于不相关视觉特征的多视图分类器学习过程;从图像中提取小波纹理、颜色直方图和边缘方向直方图的互不相关的视图;使用基于标记图像集合训练视图分类器;步骤2:基于标记样本和具有较高可信度伪标记样本的多视图分类器优化过程;得到视图下伪标记样本属于某个标注的概率:利用高斯距离得到不同视图分类器间标注性能的差异值;在任意两视图分类器标注性能差异值度量的基础上,得到所有视图分类器标注性能的差异值;对于视图而言,当未标记样本间所有标注的一致度达到最大时,则基于视图的分类器集合的性能达到最优;步骤3:基于最大熵投票原则和标注间相关性的多视图标注过程;在所有语义标注中,语义标注列表中的第一个语义标注‑‑‑类别标注,它从语义上描述了图像中主要的视觉内容;而标注列表上的其它标注则用以表示标注间的相关性;所述方法的标注过程包括:类别标注的生成,是在利用优化的多视图分类器产生标注结果的基础上,利用最大熵投票得到;利用相关性,依次得到标注列表中的其它标注。
地址 210023 江苏省南京市亚东新城区文苑路9号