发明名称 一种基于自适应位分配哈希算法的大规模图像库检索方法
摘要 一种基于自适应位分配哈希算法的大规模图像库检索方法,包括:从待检索图像库中选取部分图像作为训练集,提取训练集的GIST特征;利用PCA对训练集的特征数据进行投影,再对训练数据计算每一维的离散度;根据不同维的离散度,自适应地分配不同的位数来编码数据;根据每一维的编码长度和阈值编码每一维,得子编码,拼接成对数据的完整编码;对查询图像和待检索图像库中特征数据的处理与训练过程对应,分别计算待检索图像和查询图像特征的哈希编码;计算两者之间的汉明距离,由此快速检索相似图像。本发明具有很好的普适性,能很好地保持原始特征数据的近邻结构,利用哈希方法对数据进行编码,既减少了数据的存储空间又提高了查询的检索效率。
申请公布号 CN104021234B 申请公布日期 2017.04.19
申请号 CN201410305838.1 申请日期 2014.06.30
申请人 中国科学院自动化研究所 发明人 郭勤振;曾智;张树武
分类号 G06F17/30(2006.01)I;G06K9/62(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 中科专利商标代理有限责任公司 11021 代理人 宋焰琴
主权项 一种基于自适应位分配哈希算法的大规模图像库检索方法,包括下列步骤:步骤S1:训练步骤,从待检索图像库中选取部分图像作为训练集,计算训练集的编码长度c<sub>i</sub>和编码阈值<img file="FDA0001226038770000013.GIF" wi="71" he="73" />其中1≤i≤d,1≤j≤(c<sub>i</sub>+1),d为维度;其中所述训练步骤S1中根据每一维度的离散度自适应地为每一维分配不同的位数,第i维的编码长度c<sub>i</sub>计算公式如下:<maths num="0001"><math><![CDATA[<mrow><msub><mi>c</mi><mi>i</mi></msub><mo>=</mo><mfenced open = "{" close = ""><mtable><mtr><mtd><mrow><mo>&lsqb;</mo><mi>k</mi><mo>&CenterDot;</mo><mfrac><msub><mi>&lambda;</mi><mi>i</mi></msub><mrow><msubsup><mi>&Sigma;</mi><mrow><mi>n</mi><mo>=</mo><mi>i</mi></mrow><mi>d</mi></msubsup><msub><mi>&lambda;</mi><mi>n</mi></msub></mrow></mfrac><mo>+</mo><mn>0.5</mn><mo>&rsqb;</mo></mrow></mtd><mtd><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow></mtd></mtr><mtr><mtd><mrow><mo>&lsqb;</mo><mrow><mo>(</mo><mi>k</mi><mo>-</mo><msubsup><mi>&Sigma;</mi><mrow><mi>t</mi><mo>=</mo><mn>1</mn></mrow><mrow><mi>i</mi><mo>-</mo><mn>1</mn></mrow></msubsup><msub><mi>c</mi><mi>t</mi></msub><mo>)</mo></mrow><mo>&CenterDot;</mo><mfrac><msub><mi>&lambda;</mi><mi>i</mi></msub><mrow><msubsup><mi>&Sigma;</mi><mrow><mi>n</mi><mo>=</mo><mi>i</mi></mrow><mi>d</mi></msubsup><msub><mi>&lambda;</mi><mi>n</mi></msub></mrow></mfrac><mo>+</mo><mn>0.5</mn><mo>&rsqb;</mo></mrow></mtd><mtd><mrow><mi>i</mi><mo>&GreaterEqual;</mo><mn>2</mn></mrow></mtd></mtr></mtable></mfenced><mo>;</mo></mrow>]]></math><img file="FDA0001226038770000011.GIF" wi="1064" he="412" /></maths>其中,k是总的编码长度,λ<sub>i</sub>为每一维的离散度;步骤S2:待检索图像库编码步骤,根据训练步骤得到的编码长度c<sub>i</sub>和编码阈值<img file="FDA0001226038770000012.GIF" wi="46" he="69" />计算待检索图像的哈希编码H(y<sub>r</sub>),其中y<sub>r</sub>为待检索图像库中第r幅图像的GIST特征;步骤S3:查询步骤,先根据训练步骤得到的编码长度c<sub>i</sub>和编码阈值<img file="FDA0001226038770000014.GIF" wi="45" he="74" />计算查询图像的哈希编码H(q),其中q为查询图像d维的GIST特征;再根据查询数据编码H(q)与待检索图像库中数据编码H(y<sub>i</sub>)之间的汉明距离D<sub>h</sub>(H(q),H(y<sub>i</sub>)),返回待检索图像库中与查询数据汉明距离最小的L个数据作为检索结果,其中N为待检索图像库的大小,1≤i≤N,L为由用户设定的正整数。
地址 100190 北京市海淀区中关村东路95号