发明名称 一种基于弱监督学的图像语义解析方法
摘要 本发明公开了一种基于弱监督学的图像语义解析方法,用以解决在给定大量用户标注图像基础上,将图像分割成一系列具有单一语义的完整区域,同时对各区域实现语义标注的问题。本发明包括:联合谱聚类与判别式聚类的双重聚类方法,对由过分割方法得到的图像子区域进行聚类;同时,利用图像级别标注与图像区域级别标注的对应约束关系,构建以误差最小化为目标的弱监督学模型,为各图像子区域的聚类集合分配语义标签。此外,通过判别式聚类学到的多类分类器,可以实现针对没有标签信息图像的语义解析。本发明不仅可以给图像添加语义标签,还可以将标签添加到图像中的对应区域,实现更细粒度的图像语义理解。
申请公布号 CN103336969B 申请公布日期 2016.08.24
申请号 CN201310214812.1 申请日期 2013.05.31
申请人 中国科学院自动化研究所 发明人 卢汉清;刘静;刘洋
分类号 G06K9/62(2006.01)I;G06T7/00(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 中科专利商标代理有限责任公司 11021 代理人 宋焰琴
主权项 一种基于弱监督学习的图像语义解析方法,包括如下步骤:S2.1、采用谱聚类方法将过分割的图像子区域进行聚类,利用线性分类器作为一种判别式的聚类方法,使其与谱聚类方法共享统一的类标指示向量;S2.2、将图像的标签信息作为弱监督信息,利用图像级别标签与图像子区域级别标签的对应约束关系,为图像子区域的各个聚类添加语义标签;S2.3、用联合凹凸优化方法与非负乘子法的迭代更新过程对目标函数进行优化求解,其中,在每一轮迭代过程中,通过凹凸优化方法,用一阶泰勒展开式近似非凸函数,将原问题转化为一个凸的优化问题,反复迭代优化凸的子问题直至收敛,得到原问题的次优解。
地址 100190 北京市海淀区中关村东路95号