发明名称 |
一种基于可变长深度哈希学的图像检索方法 |
摘要 |
本发明公开一种基于可变长度深度哈希学的图像检索方法,主要涉及图像检索与深度学领域。该方法将哈希码的学建模成相似性学的过程。具体来说,该方法利用训练图像产生一批三元图像组,其中每个三元组包含两张具有相同类标的图像与一张具有不同类标的图像。对模型训练的目的是最大化匹配的图像对与不匹配的图像对在海明空间的间隔。本方法的学部分引入了深度卷积神经网络,通过对图像特征与哈希函数的联合优化,实现了端到端的训练过程。另一方面,卷积网络输出的哈希码每一位都具有不同的权重。针对不同的检索任务,用户可以通过截断不重要的比特位来实现哈希码长度的调控。同时,该方法能够在哈希码较短的情况下的有效地保持其判别性。 |
申请公布号 |
CN105512273A |
申请公布日期 |
2016.04.20 |
申请号 |
CN201510883581.2 |
申请日期 |
2015.12.03 |
申请人 |
中山大学 |
发明人 |
林倞;张瑞茂;王青;江波 |
分类号 |
G06F17/30(2006.01)I;G06N3/08(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
广州粤高专利商标代理有限公司 44102 |
代理人 |
林丽明 |
主权项 |
一种基于可变长深度哈希学习的图像检索方法,其特征在于,包括:S1.将训练图像集合划分成一批三元图像组;S2.将三元图像组输入到深度卷积神经网络中;S3.计算每张图像产生的损失,并通过反向传播算法来训练深度卷积神经网络;S4.根据用户的输入,截断不重要的哈希比特位,并且计算查询图像与数据库每张图像之间的带权重海明距离;S5.根据步骤S4中的带权重的海明距离,从小到大对数据库图像进行排序,排序结果即为返回的相似性检索结果。 |
地址 |
510275 广东省广州市海珠区新港西路135号 |