发明名称 一种基于集成哈希编码的快速图像检索方法
摘要 本发明公开了一种基于集成哈希编码的快速图像检索方法,属于数字图像检索技术领域,步骤如下:首先提取训练图像和查询图像的SIFT特征,并利用M种哈希算法对训练图像进行初始哈希编码;然后利用集成学中的一致性约束准则对初始哈希编码结果进行再学,得到集成哈希映射矩阵;最后重新对训练图像和查询图像进行集成哈希编码,并在集成哈希编码的基础上通过计算查询图像与训练图像之间的汉明距离来进行快速检索。本发明中的集成哈希编码能够同时融合不同哈希算法的特点和优势,解决了单一哈希算法判别力不足和适用范围的局限性问题,从而使得图像的快速检索更加准确和高效。
申请公布号 CN104298791A 申请公布日期 2015.01.21
申请号 CN201410657380.6 申请日期 2014.11.19
申请人 中国石油大学(华东) 发明人 李鹏;吕新荣;宋华军;任鹏
分类号 G06F17/30(2006.01)I;G06K9/46(2006.01)I;G06K9/62(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 代理人
主权项 一种基于集成哈希编码的快速图像检索方法,包括以下步骤:(1)给定数据库,将其分为训练图像数据库和查询图像数据库,对每一幅训练图像和查询图像分别提取SIFT特征并利用K‑均值聚类将其量化表示为d维的特征向量,其中n和q分别为训练图像和查询图像的数量,则所有训练图像的特征向量可以组成一个训练图像特征向量库,其中X为维的矩阵,X的每一行分别为相应训练图像的特征向量,所有查询图像的特征向量可以组成一个查询图像特征向量库,其中Y为维的矩阵,Y的每一行分别为相应查询图像的特征向量;(2)选取现有的M种不同图像哈希算法对训练图像的特征向量库X分别进行初始哈希编码,得到的初始哈希编码矩阵分别记为(m=1,…,M),其中,是一个维度为,元素取值为‑1或者1的矩阵,每一行代表一幅训练图像的初始哈希编码,n为训练图像总数,为第m种哈希算法的编码长度;(3)从训练图像的特征向量库X中随机按行挑选k幅图像得到一个子矩阵,维度是,同时对应地从每一个初始哈希编码矩阵中分别按行随机选取一个子矩阵,维度是,在每一种哈希算法的初始哈希编码子矩阵基础上,通过向量的内积来计算两幅训练图像的初始哈希编码之间的相似度,其中第m种哈希算法下的训练图像的初始哈希编码之间的相似度计算公式为: 其中为第m种哈希算法下的训练图像的初始哈希编码相似度矩阵,维度是,中的每一个元素表示第i幅训练图像与第j幅训练图像在第m种哈希算法下的相似度数值,并且,的值越大表示两幅图像的初始哈希编码越相似,反之则越不相似,代表矩阵的转置;(4)按照下面的公式计算M种不同哈希算法下的训练图像的初始哈希编码之间的平均相似度: 其中为融合了M种不同哈希算法的初始哈希编码相似度的平均相似度矩阵,维度是;(5)在平均相似度矩阵S的基础上,利用集成学习算法中的一致性约束准则进行图像哈希编码的再学习,所谓一致性约束准则是指由再学习得到的集成哈希编码计算得出的相似度要与M种不同哈希算法的平均相似度矩阵S相一致,具体过程通过最小化下面的目标函数实现: 其中为学习得到的集成哈希编码矩阵,每一行代表一幅训练图像的集成哈希编码,为集成哈希编码的长度,若集成哈希编码采用线性映射的形式,则上述目标函数可以写为: 其中为集成哈希映射矩阵,维度是,作用是将图像从特征空间映射到汉明空间, sign(.)为取符号函数;(6)对于查询图像特征向量库中的任意一幅查询图像的特征向量,利用集成哈希映射矩阵将其映射到汉明空间,得到其集成哈希编码,同时对训练图像的特征向量库X重新进行集成哈希编码,计算与每一幅训练图像的集成哈希编码之间的汉明距离,如果汉明距离的值小于阈值,则把该幅训练图像作为对应查询图像的相似图像返回给用户。
地址 266580 山东省青岛市黄岛区长江西路66号