主权项 |
一种弱监督条件下的共同对象检测方法,其特征在于,包括下列步骤:步骤1:对输入图像进行对象级检测,获取每幅图像的各初始对象区域;步骤2:对所述初始对象区域进行筛选处理,得到包含一致对象的候选对象区域:对初始对象区域进行向量化表示,按列构建整体矩阵Y<sub>i</sub>,并对整体矩阵Y<sub>i</sub>进行低秩分解,即<img file="FDA0000939117820000011.GIF" wi="387" he="182" />其中符号||·||<sub>*</sub>表示核范数,||.||<sub>1</sub>表示l<sub>1</sub>范数,Y<sub>i</sub>表示第i幅图像所对应的整体矩阵Y<sub>i</sub>,L<sub>i</sub>、E<sub>i</sub>分别对应整体矩阵Y<sub>i</sub>进行低秩分解后得到的低秩成分L<sub>i</sub>及稀疏成分E<sub>i</sub>,λ表示平衡分解后的低秩成分与稀疏成分的参数,且<img file="FDA0000939117820000012.GIF" wi="393" he="79" />其中m、n分别为整体矩阵Y<sub>i</sub>的行、列维度;通过矩阵E<sub>i</sub>对初始对象区域进行一致性判断,获取包含一致对象的候选对象区域;步骤3:基于字典D对各候选对象区域的底层特征进行对象特征的表示,得到其中层特征X,即<img file="FDA0000939117820000013.GIF" wi="699" he="89" />其中D为给定的初始化字典,Y表示候选对象区域的底层特征数据矩阵,λ表示正则化参数;步骤4:在得到每幅图像候选对象区域的中层特征后,对各幅图像中候选区域的特征进行特征相似性搜索,以确定共同对象区域;步骤5:提取每幅图像的共同对象区域的底层特征,对字典D进行更新处理,得到新的字典D<sub>C</sub>的学习模型为:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><munderover><mo>Σ</mo><mrow><mi>C</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><munder><mrow><mi>m</mi><mi>i</mi><mi>n</mi></mrow><mrow><msub><mi>A</mi><mi>C</mi></msub><mo>,</mo><msub><mi>D</mi><mi>C</mi></msub><mo>,</mo><msub><mi>E</mi><mi>C</mi></msub><mo>,</mo><msub><mi>L</mi><msub><mi>Y</mi><mi>C</mi></msub></msub><mo>,</mo><msub><mi>E</mi><msub><mi>Y</mi><mi>C</mi></msub></msub></mrow></munder><mo>|</mo><mo>|</mo><msub><mi>A</mi><mi>C</mi></msub><mo>|</mo><msub><mo>|</mo><mn>1</mn></msub><mo>+</mo><mi>α</mi><mo>·</mo><mo>|</mo><mo>|</mo><msub><mi>D</mi><mi>C</mi></msub><mo>|</mo><msub><mo>|</mo><mo>*</mo></msub><mo>+</mo><mi>β</mi><mo>·</mo><mo>|</mo><mo>|</mo><msub><mi>E</mi><mi>C</mi></msub><mo>|</mo><msub><mo>|</mo><mn>1</mn></msub><mo>+</mo><mo>|</mo><mo>|</mo><msub><mi>L</mi><msub><mi>Y</mi><mi>C</mi></msub></msub><mo>|</mo><msub><mo>|</mo><mo>*</mo></msub><mo>+</mo><mo>|</mo><mo>|</mo><msub><mi>E</mi><msub><mi>Y</mi><mi>C</mi></msub></msub><mo>|</mo><msub><mo>|</mo><mn>1</mn></msub></mrow>]]></math><img file="FDA0000939117820000014.GIF" wi="1142" he="134" /></maths>且<img file="FDA0000939117820000015.GIF" wi="315" he="63" />Y<sub>C</sub>=D<sub>C</sub>A<sub>C</sub>+E<sub>C</sub>其中,N表示图像集合中总共包含对象类别的数目,<img file="FDA0000939117820000016.GIF" wi="403" he="70" />表示包含第C类对象的图像中,候选对象区域的底层特征集合,m表示包含第C类对象的图像总数目;A<sub>C</sub>表示特征数据Y<sub>C</sub>在字典D<sub>C</sub>上的表示系数,E<sub>C</sub>为通过字典D<sub>C</sub>对数据Y<sub>C</sub>的重构误差;<img file="FDA0000939117820000018.GIF" wi="66" he="65" />和<img file="FDA0000939117820000017.GIF" wi="67" he="67" />分别表示特征数据Y<sub>C</sub>的低秩成分和稀疏成分;α、β表示正则化参数,用于平衡目标函数中对应约束项的权重;步骤6:基于更新后的字典D重复执行步骤3、4和5,直到达到设定的检测精确度或最大迭代次数M。 |