基于多哈希表映射误差最小化的图像检索方法,申请号CN201110357850.3-传众专利搜索

发明名称	基于多哈希表映射误差最小化的图像检索方法
摘要	一种基于多哈希表映射误差最小化的图像检索方法，属于图像检索技术领域。其特征是分别提取待检索图像、训练图像和查询图像的gist特征。计算训练特征的主成份方向，采用迭代量化法对主成份方向进行优化，将待检索特征和查询特征投影到优化后的主成份方向上，得到其对应的哈希码。对训练特征进行能量弱化得到新的训练特征，重复该过程，直到得到第Num组哈希码。计算查询图像Num组哈希码与待检索图像Num组哈希码之间的汉明距离，根据距离大小衡量待检索图像与查询图像之间的相似性。本发明的效果和益处是克服了单哈希表在召回率较高时汉明球半径较大的缺点，同时克服了随机映射哈希在召回率较高时需要过多哈希表的问题。
申请公布号	CN102508910A	申请公布日期	2012.06.20
申请号	CN201110357850.3	申请日期	2011.11.11
申请人	大连理工大学	发明人	付海燕;孔祥维
分类号	G06F17/30(2006.01)I	主分类号	G06F17/30(2006.01)I
代理机构	大连理工大学专利中心 21200	代理人	侯明远
主权项	1.一种基于多哈希表映射误差最小化的图像检索方法，其特征在于包括如下步骤：1)给定包含N幅图像的图像库I＝{I<sub>1</sub>，I<sub>2</sub>，...，I<sub>N</sub>}，包含M(M＜N)幅图像的训练库T＝{T<sub>1</sub>，T<sub>2</sub>，...，T<sub>M</sub>}和查询图像q；2)对于图像库I和训练库T中的每一幅图像以及查询图像q，利用gist描述符提取图像的纹理特征，每一幅图像用一个d维特征向量表示；图像库对应的所有特征向量组成图像特征库GI＝{GI<sub>1</sub>，GI<sub>2</sub>，...，GI<sub>N</sub>}，GI∈R<sup>N×d</sup>，特征库中的每个特征向量GI<sub>i</sub>(1≤i≤N)和图像库中的每幅图像I<sub>i</sub>(1≤i≤N)一一对应；训练库对应的所有特征向量组成训练特征库GT＝{GT<sub>1</sub>，GT<sub>2</sub>，...，GT<sub>M</sub>}，GT∈R<sup>M×d</sup>，训练特征库中的每个特征向量GT<sub>i</sub>(1≤i≤M)和训练库中的每幅图像T<sub>i</sub>(1≤i≤M)一一对应；查询图像q的特征向量为Gq∈R<sup>1×d</sup>；3)对于训练特征库中的M个特征向量GT，利用PCA主成份分析法提取其前K个最大特征值对应的特征向量W＝{W<sub>1</sub>，W<sub>2</sub>，...，W<sub>K</sub>}，计算GT的前K维主成分向量GTp＝{GTp<sub>1</sub>，GTp<sub>2</sub>，...，GTp<sub>M</sub>}，GTp∈R<sup>M×K</sup>；4)对于GTp，定义误差函数：<maths num="0001"><![CDATA[<math><mrow><mi>Er</mi><mo>=</mo><msubsup><mrow><mo>\|</mo><mo>\|</mo><mi>H</mi><mo>-</mo><mi>GTp</mi><mo>×</mo><mi>V</mi><mo>\|</mo><mo>\|</mo></mrow><mi>F</mi><mn>2</mn></msubsup></mrow></math>]]></maths>其中H∈{0，1}<sup>M×K</sup>是二值矩阵，<img file="FDA0000107678590000012.GIF" wi="228" he="54" />是正交矩阵，\|\|·\|\|<sub>F</sub>是Frobenius范数；采用迭代法求解使得Er最小时的H和V：H(t)＝sgn(GTp×V(t))<maths num="0002"><![CDATA[<math><mrow><mo>[</mo><mi>U</mi><mo>,</mo><mi>S</mi><mo>,</mo><msup><mover><mi>U</mi><mo>^</mo></mover><mi>T</mi></msup><mo>]</mo><mo>=</mo><mi>svd</mi><mrow><mo>(</mo><mi>H</mi><msup><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mi>T</mi></msup><mo>×</mo><mi>GTp</mi><mo>)</mo></mrow></mrow></math>]]></maths><maths num="0003"><![CDATA[<math><mrow><mi>V</mi><mrow><mo>(</mo><mi>t</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow><mo>=</mo><mover><mi>U</mi><mo>^</mo></mover><msup><mi>U</mi><mi>T</mi></msup></mrow></math>]]></maths>其中t表示第t次迭代，sgn(·)表示符号函数，上标T表示转置，svd(·)是奇异值分解函数，<img file="FDA0000107678590000021.GIF" wi="224" he="68" />是奇异值分解的结果；5)对训练特征库GT进行能量弱化，得到新的训练特征库<img file="FDA0000107678590000022.GIF" wi="106" he="67" /><maths num="0004"><![CDATA[<math><mrow><mover><mi>GT</mi><mo>~</mo></mover><mo>=</mo><mi>GT</mi><mo>-</mo><mi>GT</mi><mo>×</mo><msub><mi>W</mi><mn>1</mn></msub><mo>×</mo><msup><msub><mi>W</mi><mn>1</mn></msub><mi>T</mi></msup></mrow></math>]]></maths>6)给定哈希表数Num，对于i＝1，...，Num，重复步骤(3)～(5)，得到Num组参数V和R；定义哈希函数H(x)＝sgn(x×V×R)；对于GI<sub>i</sub>和Gq，利用Num组参数V和R可分别获得其对应的Num组长度为K的哈希码；7)定义汉明距离：DH<sub>x，y</sub>＝∑xor(H(x)，H(y))其中xor(，)表示按位异或操作，∑是对按位异或后的结果求和；对于查询特征Gq和图像特征库的每个特征GI<sub>i</sub>，计算它们Num组哈希码之间的汉明距离的平均值：<maths num="0005"><![CDATA[<math><mrow><msub><mi>d</mi><mrow><msub><mi>I</mi><mi>i</mi></msub><mo>,</mo><mi>q</mi></mrow></msub><mo>=</mo><mfrac><mn>1</mn><mi>Num</mi></mfrac><munderover><mi>Σ</mi><mrow><mi>p</mi><mo>=</mo><mn>1</mn></mrow><mi>Num</mi></munderover><msubsup><mi>DH</mi><mrow><msub><mi>I</mi><mi>i</mi></msub><mo>,</mo><mi>q</mi></mrow><mi>p</mi></msubsup></mrow></math>]]></maths>其中<img file="FDA0000107678590000025.GIF" wi="129" he="61" />表示GI<sub>i</sub>第p组哈希码和Gq的第p组哈希码之间的距离<img file="FDA0000107678590000026.GIF" wi="152" he="64" />根据<img file="FDA0000107678590000027.GIF" wi="81" he="64" />的大小判断图像库中图像与查询图像之间的相似性。
地址	116024 辽宁省大连市凌工路2号