发明名称 基于图像哈希的大规模图像库检索方法
摘要 一种基于图像哈希的大规模图像库检索方法,属于图像检索技术领域,涉及基于内容的图像检索方法。其特征是从待检索的图像库中选取与查询图像相关的训练图像;分别提取待检索图像、训练图像和查询图像的Gist特征。利用K均值聚类法将训练特征聚成C类;对每类样本特征,计算其超球面分类函数 <mrow> <msub> <mi>P</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <msub> <mi>m</mi> <mi>i</mi> </msub> </munderover> <msub> <mi>&alpha;</mi> <mi>i</mi> </msub> <mi>K</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>,</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>;</mo> </mrow>由此定义哈希函数为 <mrow> <msub> <mi>H</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>=</mo> <mi>sign</mi> <mrow> <mo>(</mo> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <msub> <mi>m</mi> <mi>i</mi> </msub> </munderover> <msub> <mi>&alpha;</mi> <mi>i</mi> </msub> <mi>K</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>,</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>)</mo> </mrow> <mo>;</mo> </mrow>计算待检索图像特征和查询图像特征的哈希序列;并计算查询图像哈希序列与待检索图像哈希序列之间的汉明距离;设定阈值d,返回相似的图像。本发明的效果和益处是克服了LSH方法哈希函数数量多的问题;解决了谱哈希法和语义哈希法不能扩展到核空间的问题,同时也完善了KLSH方法计算哈希函数时对样本的选择问题。
申请公布号 CN101710334B 申请公布日期 2012.01.25
申请号 CN200910220599.9 申请日期 2009.12.04
申请人 大连理工大学 发明人 孔祥维;付海燕;杨德礼;郭艳卿
分类号 G06F17/30(2006.01)I;G06K9/62(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 大连理工大学专利中心 21200 代理人 侯明远
主权项 一种基于图像哈希的大规模图像库检索方法,其特征在于包括如下步骤:1)建立图像库I={I1,I2,...,IN},其中包含N幅图像;从图像库中挑选M幅(M<N)包含同一对象的图像,组成训练库T={T1,T2,...,TM};2)对于图像库I和训练库T中的每一幅图像,利用Gist描述符提取图像的纹理特征,每一幅图像用一个高维特征向量表示;图像库对应的所有特征向量组成图像特征库GI={GI1,GI2,...,GIN},特征库中的每个特征向量GIi,(1≤i≤N)和图像库中的每幅图像Ii,(1≤i≤N)一一对应;训练库对应的所有特征向量组成训练特征库GT={GT1,GT2,...,GTM},特征库中的每个特征向量GTi,(1≤i≤M)和训练库中的每幅图像Ti,(1≤i≤M)一一对应;3)对于训练特征库中的M个特征向量GT={GT1,GT2,...,GTM},利用K均值聚类将其聚成C类,得到C组聚类样本S={S1,S2,...,SC};4)对于每一组聚类样本Si,(1≤i≤C),定义基于核函数的超球面分类函数: <mrow> <msub> <mi>P</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mi>&Sigma;</mi> <mrow> <mi>p</mi> <mo>=</mo> <mn>1</mn> </mrow> <msub> <mi>m</mi> <mi>i</mi> </msub> </munderover> <msub> <mi>&alpha;</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>p</mi> </mrow> </msub> <mi>K</mi> <mrow> <mo>(</mo> <msub> <mi>S</mi> <mi>i</mi> </msub> <mo>,</mo> <mi>x</mi> <mo>)</mo> </mrow> </mrow>其中mi是Si,(1≤i≤C)中包含的样本数;αi是mi维向量,通过训练得到;K(Si,x)是核函数,选择径向基核函数;根据已知的训练样本Si,(1≤i≤C),求解如下方程得到αi: <mrow> <mi>min</mi> <mrow> <mo>(</mo> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> <msup> <mrow> <mo>|</mo> <mo>|</mo> <msub> <mi>&alpha;</mi> <mi>i</mi> </msub> <mo>|</mo> <mo>|</mo> </mrow> <mn>2</mn> </msup> <mo>)</mo> </mrow> </mrow>约束条件为<αi·Si>>1,i=1,2,...,C从而确定最优超球面分类面,该分类面是能最大限度的包含所有聚类样本的最小分类面;5)根据已求得的超球面分类函数P(x)={P1(x),P2(x),...,PC(x)},定义哈希函数簇H(x)={H1(x),H2(x),...,HC(x)},其中 <mrow> <msub> <mi>H</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>=</mo> <mi>sign</mi> <mrow> <mo>(</mo> <msub> <mi>P</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open='{' close=''> <mtable> <mtr> <mtd> <mn>1</mn> </mtd> <mtd> <msub> <mi>P</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>></mo> <mo>=</mo> <mn>0</mn> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mi>else</mi> </mtd> </mtr> </mtable> </mfenced> </mrow>对于特征库中的每个特征向量GIi,(1≤i≤N),利用哈希函数簇H(x)={H1(x),H2(x),...,HC(x)}生成长度为C的哈希序列HIi={H1Ii,...,HCIi},(1≤i≤N);6)对于查询图像Q,提取其Gist特征向量GQ后,利用哈希函数簇H(x)={H1(x),H2(x),...,HC(x)}构造其对应的查询哈希序列HQ={H1Q,...,HCQ};7)对于查询哈希序列HQ={H1Q,...,HCQ}和图像特征库的每个哈希序列HIi={H1Ii,...,HCIi},(1≤i≤N),计算它们之间的汉明距离DHiQ=∑xor(HIi,HQ),(1≤i≤N),根据距离大小判断图像库中图像与查询图像之间的相似性。
地址 116024 辽宁省大连市甘井子区凌工路2号