发明名称 一种弱监督条件下的共同对象检测方法
摘要 本发明公开了一种弱监督条件下的共同对象检测方法,属于图像处理技术领域。本发明首先对输入图像进行对象级检测,获取每幅图像的各初始对象区域;并对初始对象区域进行筛选处理,得到包含一致对象的候选对象区域;然后基于字典对各候选对象区域的特征进行对象特征表示,得到中层特征;对同一类别对象,基于每幅图像候选对象区域的中层特征,对各幅图像进行共同对象定位,得到共同对象区域;再提取每幅图像所述的共同对象区域的特征信息,对字典进行更新;共同对象定位和字典学交替重复进行,直到达到设定的检测精确度或最大迭代次数M。本发明能基于弱监督力的类别标注信息,经过多次字典更新后实现共同对象检测。
申请公布号 CN103268607B 申请公布日期 2016.10.12
申请号 CN201310179996.2 申请日期 2013.05.15
申请人 电子科技大学 发明人 李宏亮;谢昱锐
分类号 G06T7/00(2006.01)I 主分类号 G06T7/00(2006.01)I
代理机构 电子科技大学专利中心 51203 代理人 周刘英
主权项 一种弱监督条件下的共同对象检测方法,其特征在于,包括下列步骤:步骤1:对输入图像进行对象级检测,获取每幅图像的各初始对象区域;步骤2:对所述初始对象区域进行筛选处理,得到包含一致对象的候选对象区域:对初始对象区域进行向量化表示,按列构建整体矩阵Y<sub>i</sub>,并对整体矩阵Y<sub>i</sub>进行低秩分解,即<img file="FDA0000939117820000011.GIF" wi="387" he="182" />其中符号||·||<sub>*</sub>表示核范数,||.||<sub>1</sub>表示l<sub>1</sub>范数,Y<sub>i</sub>表示第i幅图像所对应的整体矩阵Y<sub>i</sub>,L<sub>i</sub>、E<sub>i</sub>分别对应整体矩阵Y<sub>i</sub>进行低秩分解后得到的低秩成分L<sub>i</sub>及稀疏成分E<sub>i</sub>,λ表示平衡分解后的低秩成分与稀疏成分的参数,且<img file="FDA0000939117820000012.GIF" wi="393" he="79" />其中m、n分别为整体矩阵Y<sub>i</sub>的行、列维度;通过矩阵E<sub>i</sub>对初始对象区域进行一致性判断,获取包含一致对象的候选对象区域;步骤3:基于字典D对各候选对象区域的底层特征进行对象特征的表示,得到其中层特征X,即<img file="FDA0000939117820000013.GIF" wi="699" he="89" />其中D为给定的初始化字典,Y表示候选对象区域的底层特征数据矩阵,λ表示正则化参数;步骤4:在得到每幅图像候选对象区域的中层特征后,对各幅图像中候选区域的特征进行特征相似性搜索,以确定共同对象区域;步骤5:提取每幅图像的共同对象区域的底层特征,对字典D进行更新处理,得到新的字典D<sub>C</sub>的学习模型为:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><munderover><mo>&Sigma;</mo><mrow><mi>C</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><munder><mrow><mi>m</mi><mi>i</mi><mi>n</mi></mrow><mrow><msub><mi>A</mi><mi>C</mi></msub><mo>,</mo><msub><mi>D</mi><mi>C</mi></msub><mo>,</mo><msub><mi>E</mi><mi>C</mi></msub><mo>,</mo><msub><mi>L</mi><msub><mi>Y</mi><mi>C</mi></msub></msub><mo>,</mo><msub><mi>E</mi><msub><mi>Y</mi><mi>C</mi></msub></msub></mrow></munder><mo>|</mo><mo>|</mo><msub><mi>A</mi><mi>C</mi></msub><mo>|</mo><msub><mo>|</mo><mn>1</mn></msub><mo>+</mo><mi>&alpha;</mi><mo>&CenterDot;</mo><mo>|</mo><mo>|</mo><msub><mi>D</mi><mi>C</mi></msub><mo>|</mo><msub><mo>|</mo><mo>*</mo></msub><mo>+</mo><mi>&beta;</mi><mo>&CenterDot;</mo><mo>|</mo><mo>|</mo><msub><mi>E</mi><mi>C</mi></msub><mo>|</mo><msub><mo>|</mo><mn>1</mn></msub><mo>+</mo><mo>|</mo><mo>|</mo><msub><mi>L</mi><msub><mi>Y</mi><mi>C</mi></msub></msub><mo>|</mo><msub><mo>|</mo><mo>*</mo></msub><mo>+</mo><mo>|</mo><mo>|</mo><msub><mi>E</mi><msub><mi>Y</mi><mi>C</mi></msub></msub><mo>|</mo><msub><mo>|</mo><mn>1</mn></msub></mrow>]]></math><img file="FDA0000939117820000014.GIF" wi="1142" he="134" /></maths>且<img file="FDA0000939117820000015.GIF" wi="315" he="63" />Y<sub>C</sub>=D<sub>C</sub>A<sub>C</sub>+E<sub>C</sub>其中,N表示图像集合中总共包含对象类别的数目,<img file="FDA0000939117820000016.GIF" wi="403" he="70" />表示包含第C类对象的图像中,候选对象区域的底层特征集合,m表示包含第C类对象的图像总数目;A<sub>C</sub>表示特征数据Y<sub>C</sub>在字典D<sub>C</sub>上的表示系数,E<sub>C</sub>为通过字典D<sub>C</sub>对数据Y<sub>C</sub>的重构误差;<img file="FDA0000939117820000018.GIF" wi="66" he="65" />和<img file="FDA0000939117820000017.GIF" wi="67" he="67" />分别表示特征数据Y<sub>C</sub>的低秩成分和稀疏成分;α、β表示正则化参数,用于平衡目标函数中对应约束项的权重;步骤6:基于更新后的字典D重复执行步骤3、4和5,直到达到设定的检测精确度或最大迭代次数M。
地址 611731 四川省成都市高新区(西区)西源大道2006号