一种弱监督条件下的共同对象检测方法,申请号CN201310179996.2-传众专利搜索

发明名称	一种弱监督条件下的共同对象检测方法
摘要	本发明公开了一种弱监督条件下的共同对象检测方法，属于图像处理技术领域。本发明首先对输入图像进行对象级检测，获取每幅图像的各初始对象区域；并对初始对象区域进行筛选处理，得到包含一致对象的候选对象区域；然后基于字典对各候选对象区域的特征进行对象特征表示，得到中层特征；对同一类别对象，基于每幅图像候选对象区域的中层特征，对各幅图像进行共同对象定位，得到共同对象区域；再提取每幅图像所述的共同对象区域的特征信息，对字典进行更新；共同对象定位和字典学交替重复进行，直到达到设定的检测精确度或最大迭代次数M。本发明能基于弱监督力的类别标注信息，经过多次字典更新后实现共同对象检测。
申请公布号	CN103268607B	申请公布日期	2016.10.12
申请号	CN201310179996.2	申请日期	2013.05.15
申请人	电子科技大学	发明人	李宏亮;谢昱锐
分类号	G06T7/00(2006.01)I	主分类号	G06T7/00(2006.01)I
代理机构	电子科技大学专利中心 51203	代理人	周刘英
主权项	一种弱监督条件下的共同对象检测方法，其特征在于，包括下列步骤：步骤1：对输入图像进行对象级检测，获取每幅图像的各初始对象区域；步骤2：对所述初始对象区域进行筛选处理，得到包含一致对象的候选对象区域：对初始对象区域进行向量化表示，按列构建整体矩阵Y<sub>i</sub>，并对整体矩阵Y<sub>i</sub>进行低秩分解，即<img file="FDA0000939117820000011.GIF" wi="387" he="182" />其中符号\|\|·\|\|<sub></sub>表示核范数，\|\|.\|\|<sub>1</sub>表示l<sub>1</sub>范数，Y<sub>i</sub>表示第i幅图像所对应的整体矩阵Y<sub>i</sub>，L<sub>i</sub>、E<sub>i</sub>分别对应整体矩阵Y<sub>i</sub>进行低秩分解后得到的低秩成分L<sub>i</sub>及稀疏成分E<sub>i</sub>，λ表示平衡分解后的低秩成分与稀疏成分的参数，且<img file="FDA0000939117820000012.GIF" wi="393" he="79" />其中m、n分别为整体矩阵Y<sub>i</sub>的行、列维度；通过矩阵E<sub>i</sub>对初始对象区域进行一致性判断，获取包含一致对象的候选对象区域；步骤3：基于字典D对各候选对象区域的底层特征进行对象特征的表示，得到其中层特征X，即<img file="FDA0000939117820000013.GIF" wi="699" he="89" />其中D为给定的初始化字典，Y表示候选对象区域的底层特征数据矩阵，λ表示正则化参数；步骤4：在得到每幅图像候选对象区域的中层特征后，对各幅图像中候选区域的特征进行特征相似性搜索，以确定共同对象区域；步骤5：提取每幅图像的共同对象区域的底层特征，对字典D进行更新处理，得到新的字典D<sub>C</sub>的学习模型为：<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><munderover><mo>Σ</mo><mrow><mi>C</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><munder><mrow><mi>m</mi><mi>i</mi><mi>n</mi></mrow><mrow><msub><mi>A</mi><mi>C</mi></msub><mo>,</mo><msub><mi>D</mi><mi>C</mi></msub><mo>,</mo><msub><mi>E</mi><mi>C</mi></msub><mo>,</mo><msub><mi>L</mi><msub><mi>Y</mi><mi>C</mi></msub></msub><mo>,</mo><msub><mi>E</mi><msub><mi>Y</mi><mi>C</mi></msub></msub></mrow></munder><mo>\|</mo><mo>\|</mo><msub><mi>A</mi><mi>C</mi></msub><mo>\|</mo><msub><mo>\|</mo><mn>1</mn></msub><mo>+</mo><mi>α</mi><mo>·</mo><mo>\|</mo><mo>\|</mo><msub><mi>D</mi><mi>C</mi></msub><mo>\|</mo><msub><mo>\|</mo><mo></mo></msub><mo>+</mo><mi>β</mi><mo>·</mo><mo>\|</mo><mo>\|</mo><msub><mi>E</mi><mi>C</mi></msub><mo>\|</mo><msub><mo>\|</mo><mn>1</mn></msub><mo>+</mo><mo>\|</mo><mo>\|</mo><msub><mi>L</mi><msub><mi>Y</mi><mi>C</mi></msub></msub><mo>\|</mo><msub><mo>\|</mo><mo>*</mo></msub><mo>+</mo><mo>\|</mo><mo>\|</mo><msub><mi>E</mi><msub><mi>Y</mi><mi>C</mi></msub></msub><mo>\|</mo><msub><mo>\|</mo><mn>1</mn></msub></mrow>]]></math><img file="FDA0000939117820000014.GIF" wi="1142" he="134" /></maths>且<img file="FDA0000939117820000015.GIF" wi="315" he="63" />Y<sub>C</sub>＝D<sub>C</sub>A<sub>C</sub>+E<sub>C</sub>其中，N表示图像集合中总共包含对象类别的数目，<img file="FDA0000939117820000016.GIF" wi="403" he="70" />表示包含第C类对象的图像中，候选对象区域的底层特征集合，m表示包含第C类对象的图像总数目；A<sub>C</sub>表示特征数据Y<sub>C</sub>在字典D<sub>C</sub>上的表示系数，E<sub>C</sub>为通过字典D<sub>C</sub>对数据Y<sub>C</sub>的重构误差；<img file="FDA0000939117820000018.GIF" wi="66" he="65" />和<img file="FDA0000939117820000017.GIF" wi="67" he="67" />分别表示特征数据Y<sub>C</sub>的低秩成分和稀疏成分；α、β表示正则化参数，用于平衡目标函数中对应约束项的权重；步骤6：基于更新后的字典D重复执行步骤3、4和5，直到达到设定的检测精确度或最大迭代次数M。
地址	611731 四川省成都市高新区（西区）西源大道2006号