主权项 |
基于超图学习的室内场景分类方法,其特征在于包括以下步骤:(1)使用近百个目标检测子从图像中抽取出目标,再根据形成的目标描述符组成的一个超级描述符,作为图像的特征描述符;(2)使用K近邻方法对所有生成的图像描述符构建超图,并基于生成的超图计算出其拉普拉斯矩阵,进而构建半监督学习框架;所述构建半监督学习框架的具体方法为:首先计算出提取的图像的特征描述符两两之间的欧氏距离,并以此得到相关矩阵H:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>H</mi><mrow><mo>(</mo><mi>v</mi><mo>,</mo><mi>e</mi><mo>)</mo></mrow><mo>=</mo><mfenced open = '{' close = ''><mtable><mtr><mtd><mrow><mn>1</mn><mo>,</mo></mrow></mtd><mtd><mtable><mtr><mtd><mrow><mi>i</mi><mi>f</mi></mrow></mtd><mtd><mrow><mi>v</mi><mo>∈</mo><mi>e</mi></mrow></mtd></mtr></mtable></mtd></mtr><mtr><mtd><mrow><mn>0</mn><mo>,</mo></mrow></mtd><mtd><mtable><mtr><mtd><mrow><mi>i</mi><mi>f</mi></mrow></mtd><mtd><mrow><mi>v</mi><mo>∉</mo><mi>e</mi></mrow></mtd></mtr></mtable></mtd></mtr></mtable></mfenced></mrow>]]></math><img file="FDA0000959533670000011.GIF" wi="504" he="156" /></maths>其中v表示超图的结点,e表示超图的边;进而可以计算超图中每条边的权重w(e)、每个节点的度数d(v)和每条超边的度数δ(e),同时可使用w(e)、d(v)和δ(e)作为对角元素构造其相关的对角矩阵W、D<sub>v</sub>和D<sub>e</sub>,根据这三个对角矩阵及相关矩阵,可以计算得到中间结果Θ为:<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mi>Θ</mi><mo>=</mo><msubsup><mi>D</mi><mi>v</mi><mrow><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>/</mo><mn>2</mn><mo>)</mo></mrow></mrow></msubsup><msubsup><mi>HWD</mi><mi>e</mi><mrow><mo>-</mo><mn>1</mn></mrow></msubsup><msup><mi>H</mi><mi>T</mi></msup><msubsup><mi>D</mi><mi>v</mi><mrow><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>/</mo><mn>2</mn><mo>)</mo></mrow></mrow></msubsup></mrow>]]></math><img file="FDA0000959533670000012.GIF" wi="665" he="71" /></maths>使用单位矩阵I减去Θ则可得:L=I‑Θ计算结果L即表示该超图的拉普拉斯矩阵;基于该拉普拉斯矩阵可以构建出半监督学习框架的正则化项:Ω(f)=f<sup>T</sup>Lf其中f表示需要预测图像的标签向量,f<sup>T</sup>表示向量f的转置向量;进而构造出半监督框架,其公式如下:<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><mi>arg</mi><munder><mrow><mi>m</mi><mi>i</mi><mi>n</mi></mrow><mi>F</mi></munder><mi>t</mi><mi>r</mi><mi> </mi><msup><mi>F</mi><mi>T</mi></msup><mi>L</mi><mi>F</mi><mo>+</mo><mi>λ</mi><mi>t</mi><mi>r</mi><mo>[</mo><msup><mrow><mo>(</mo><mi>F</mi><mo>-</mo><mi>Y</mi><mo>)</mo></mrow><mi>T</mi></msup><mrow><mo>(</mo><mi>F</mi><mo>-</mo><mi>Y</mi><mo>)</mo></mrow><mo>]</mo></mrow>]]></math><img file="FDA0000959533670000013.GIF" wi="906" he="84" /></maths>其中Y表示对图像进行标注的矩阵,tr表示计算矩阵的迹,λ参数是一个非负的数,控制着模型复杂度和经验损失函数之间的平衡;通过计算该公式,可以得到全部数据的预测标签F;(3)构建一个线性回归模型,并将该线性回归模型加入到半监督学习框架内;(4)依据步骤(3)中所构建的半监督学习框架,并结合步骤(1)所提取的图像的特征描述符,对部分图像描述符进行标注,使得该半监督学习框能够自动迭代地预测出未标注图像的标签,从而完成图像分类,同时,步骤(3)中的线性回归模型在自动迭代过程中被初始化;(5)依据步骤(3)中的线性回归模型,并结合步骤(1)所提取的图像的特征描述符,可以对新加入的数据直接进行图像分类,而无须再次构建超图。 |