主权项 |
一种基于谱图分析的图像检索方法,其特征在于包括以下五个步骤:步骤(1)、基于线性迭代聚类的层次化超像素分割:超像素分割将在颜色和空间上相似的点聚集在一起;使用两种分割数目的超像素;一种超像素分割为物体级别分割,用来为谱聚类的构建相似度矩阵,另一种为细节级别分割,用来计算双调和距离构成每一部分的特征描述;步骤(2)、基于双调和距离度量的图像特征描述:双调和距离可通过下面公式进行计算: <mrow> <msub> <mi>d</mi> <mi>B</mi> </msub> <msup> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>=</mo> <msubsup> <mi>Σ</mi> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mo>∞</mo> </msubsup> <mfrac> <msup> <mrow> <mo>(</mo> <msub> <mi>φ</mi> <mi>k</mi> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>-</mo> <msub> <mi>φ</mi> <mi>k</mi> </msub> <mrow> <mo>(</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo>)</mo> </mrow> <mn>2</mn> </msup> <msubsup> <mi>λ</mi> <mi>k</mi> <mn>2</mn> </msubsup> </mfrac> </mrow>其中dB(x,y)为x,y之间的双调和距离,φk(x)为x处第k个特征向量,λk为第k个特征值,得到图像的局部和全局拓扑结构;接下来使用超像素之间的双调和距离作为特征的度量;步骤(3)、基于谱聚类的图像特征分析:基于之前物体级别的超像素,使用谱聚类来对超像素进行聚类,得到更加具有语义级别的分类;步骤(4)、基于词袋模型的图像描述子设计:将图像作为“文档”,图像中的每一部分作为一个“词”,通过对许多图像中的“词”进行分类,构建“词典”,其中每个“词”都属于一个词典;对每一幅图像进行词频的统计,得到图像描述子;步骤(5)、图像检索测试:对图像库中的图像进行计算,每一幅图像都获得一个图像描述子;给定一张新的图像,通过步骤(1)‑(3)对图像进行计算,得到新的描述子;然后将新的描述子与图像库中的描述子进行距离度量,来检索与新图像最为匹配的图像。 |