主权项 |
1.一种基于多哈希表映射误差最小化的图像检索方法,其特征在于包括如下步骤:1)给定包含N幅图像的图像库I={I<sub>1</sub>,I<sub>2</sub>,...,I<sub>N</sub>},包含M(M<N)幅图像的训练库T={T<sub>1</sub>,T<sub>2</sub>,...,T<sub>M</sub>}和查询图像q;2)对于图像库I和训练库T中的每一幅图像以及查询图像q,利用gist描述符提取图像的纹理特征,每一幅图像用一个d维特征向量表示;图像库对应的所有特征向量组成图像特征库GI={GI<sub>1</sub>,GI<sub>2</sub>,...,GI<sub>N</sub>},GI∈R<sup>N×d</sup>,特征库中的每个特征向量GI<sub>i</sub>(1≤i≤N)和图像库中的每幅图像I<sub>i</sub>(1≤i≤N)一一对应;训练库对应的所有特征向量组成训练特征库GT={GT<sub>1</sub>,GT<sub>2</sub>,...,GT<sub>M</sub>},GT∈R<sup>M×d</sup>,训练特征库中的每个特征向量GT<sub>i</sub>(1≤i≤M)和训练库中的每幅图像T<sub>i</sub>(1≤i≤M)一一对应;查询图像q的特征向量为Gq∈R<sup>1×d</sup>;3)对于训练特征库中的M个特征向量GT,利用PCA主成份分析法提取其前K个最大特征值对应的特征向量W={W<sub>1</sub>,W<sub>2</sub>,...,W<sub>K</sub>},计算GT的前K维主成分向量GTp={GTp<sub>1</sub>,GTp<sub>2</sub>,...,GTp<sub>M</sub>},GTp∈R<sup>M×K</sup>;4)对于GTp,定义误差函数:<maths num="0001"><![CDATA[<math><mrow><mi>Er</mi><mo>=</mo><msubsup><mrow><mo>|</mo><mo>|</mo><mi>H</mi><mo>-</mo><mi>GTp</mi><mo>×</mo><mi>V</mi><mo>|</mo><mo>|</mo></mrow><mi>F</mi><mn>2</mn></msubsup></mrow></math>]]></maths>其中H∈{0,1}<sup>M×K</sup>是二值矩阵,<img file="FDA0000107678590000012.GIF" wi="228" he="54" />是正交矩阵,||·||<sub>F</sub>是Frobenius范数;采用迭代法求解使得Er最小时的H和V:H(t)=sgn(GTp×V(t))<maths num="0002"><![CDATA[<math><mrow><mo>[</mo><mi>U</mi><mo>,</mo><mi>S</mi><mo>,</mo><msup><mover><mi>U</mi><mo>^</mo></mover><mi>T</mi></msup><mo>]</mo><mo>=</mo><mi>svd</mi><mrow><mo>(</mo><mi>H</mi><msup><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mi>T</mi></msup><mo>×</mo><mi>GTp</mi><mo>)</mo></mrow></mrow></math>]]></maths><maths num="0003"><![CDATA[<math><mrow><mi>V</mi><mrow><mo>(</mo><mi>t</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow><mo>=</mo><mover><mi>U</mi><mo>^</mo></mover><msup><mi>U</mi><mi>T</mi></msup></mrow></math>]]></maths>其中t表示第t次迭代,sgn(·)表示符号函数,上标T表示转置,svd(·)是奇异值分解函数,<img file="FDA0000107678590000021.GIF" wi="224" he="68" />是奇异值分解的结果;5)对训练特征库GT进行能量弱化,得到新的训练特征库<img file="FDA0000107678590000022.GIF" wi="106" he="67" /><maths num="0004"><![CDATA[<math><mrow><mover><mi>GT</mi><mo>~</mo></mover><mo>=</mo><mi>GT</mi><mo>-</mo><mi>GT</mi><mo>×</mo><msub><mi>W</mi><mn>1</mn></msub><mo>×</mo><msup><msub><mi>W</mi><mn>1</mn></msub><mi>T</mi></msup></mrow></math>]]></maths>6)给定哈希表数Num,对于i=1,...,Num,重复步骤(3)~(5),得到Num组参数V和R;定义哈希函数H(x)=sgn(x×V×R);对于GI<sub>i</sub>和Gq,利用Num组参数V和R可分别获得其对应的Num组长度为K的哈希码;7)定义汉明距离:DH<sub>x,y</sub>=∑xor(H(x),H(y))其中xor(,)表示按位异或操作,∑是对按位异或后的结果求和;对于查询特征Gq和图像特征库的每个特征GI<sub>i</sub>,计算它们Num组哈希码之间的汉明距离的平均值:<maths num="0005"><![CDATA[<math><mrow><msub><mi>d</mi><mrow><msub><mi>I</mi><mi>i</mi></msub><mo>,</mo><mi>q</mi></mrow></msub><mo>=</mo><mfrac><mn>1</mn><mi>Num</mi></mfrac><munderover><mi>Σ</mi><mrow><mi>p</mi><mo>=</mo><mn>1</mn></mrow><mi>Num</mi></munderover><msubsup><mi>DH</mi><mrow><msub><mi>I</mi><mi>i</mi></msub><mo>,</mo><mi>q</mi></mrow><mi>p</mi></msubsup></mrow></math>]]></maths>其中<img file="FDA0000107678590000025.GIF" wi="129" he="61" />表示GI<sub>i</sub>第p组哈希码和Gq的第p组哈希码之间的距离<img file="FDA0000107678590000026.GIF" wi="152" he="64" />根据<img file="FDA0000107678590000027.GIF" wi="81" he="64" />的大小判断图像库中图像与查询图像之间的相似性。 |