发明名称 一种基于潜在语义最小哈希的图像检索方法
摘要 本发明属于图像处理技术领域,具体涉及一种基于潜在语义最小哈希的图像检索方法,包括以下步骤:(1)划分数据集;(2)构建基于潜在语义最小哈希模型;(3)求解变换矩阵T;(4)对测试数据集X<sub>test</sub>进行哈希编码;(5)图像查询。本发明利用了卷积网络具有较好的表达特性以及利用矩阵分解能够提取原始特征的潜在语义特性,在编码量化阶段通过对量化误差做最小化约束,使得原始特征经过编码后,在语义上具有相似性的图像在汉明空间其对应的汉明距离较小,而语义上不相似的图像,其对应的汉明距离较大,从而提高了图像检索的精度以及索引的效率。
申请公布号 CN106033426A 申请公布日期 2016.10.19
申请号 CN201510106890.9 申请日期 2015.03.11
申请人 中国科学院西安光学精密机械研究所 发明人 李学龙;卢孝强;袁勇
分类号 G06F17/30(2006.01)I;G06K9/62(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 西安智邦专利商标代理有限公司 61211 代理人 倪金荣
主权项 一种基于潜在语义最小哈希的图像检索方法,其特征在于:包括以下步骤:1】划分数据集:在数据集中随机抽取部分图像作为测试集,其余图像作为训练集;2】构建基于潜在语义最小哈希模型:2.1】使用卷积网络模型对测试集和训练集中的每一幅图像提取卷积网络特征,并对提取的卷积网络特征做L<sub>2</sub>规范化;训练集对应生成训练特征向量集X<sub>train</sub>,测试集对应生成测试特征向量集X<sub>test</sub>;对X<sub>train</sub>和X<sub>test</sub>进行统一的中心化处理;2.2】对中心化处理后的训练特征向量集X<sub>train</sub>进行矩阵分解得到其潜在语义表示,同时在量化编码时对其作量化误差最小化限制;构造的潜在语义最小哈希模型为:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><munder><mrow><mi>arg</mi><mi>min</mi></mrow><mi>T</mi></munder><mo>=</mo><msubsup><mrow><mo>|</mo><mo>|</mo><mi>X</mi><mo>-</mo><mi>VU</mi><mo>|</mo><mo>|</mo></mrow><mi>F</mi><mn>2</mn></msubsup><mo>+</mo><mi>&lambda;</mi><msubsup><mrow><mo>|</mo><mo>|</mo><mi>Y</mi><mo>-</mo><mi>VT</mi><mo>|</mo><mo>|</mo></mrow><mi>F</mi><mn>2</mn></msubsup><mo>+</mo><msub><mi>&gamma;</mi><mn>1</mn></msub><msubsup><mrow><mo>|</mo><mo>|</mo><mi>V</mi><mo>|</mo><mo>|</mo></mrow><mi>F</mi><mn>2</mn></msubsup><mo>+</mo><msub><mi>&gamma;</mi><mn>2</mn></msub><msubsup><mrow><mo>|</mo><mo>|</mo><mi>U</mi><mo>|</mo><mo>|</mo></mrow><mi>F</mi><mn>2</mn></msubsup></mrow>]]></math><img file="FDA0000680594770000011.GIF" wi="1373" he="125" /></maths>T<sup>T</sup>T=I其中,X为特征向量集,λ、γ<sub>1</sub>和γ<sub>2</sub>为权重参数,U为X经过矩阵分解后的基,V为X分解后得到的X的潜在语义表示变量,Y为X经过哈希编码后的哈希序列;3】求解变换矩阵T:将X<sub>train</sub>代入X后,使用交替迭代方法求解所述潜在语义最小哈希模型,生成变换矩阵T;计算Y=sgn(VT),得到训练数据集的哈希序列Y<sub>train</sub>;4】对测试数据集X<sub>test</sub>进行哈希编码:4.1】随机初始化潜在语义表示变量V;4.2】计算编码后的哈希序列Y=sgn(VT);4.3】计算X<sub>test</sub>的潜在语义表示变量V=(X<sub>test</sub>U<sup>T</sup>+λI)(U<sup>T</sup>U+λI+γ<sub>2</sub>I)<sup>‑1</sup>;4.4】重复步骤4.2】‑步骤4.3】,直至V收敛;4.5】计算Y=sgn(VT),得到测试数据集的哈希序列Y<sub>test</sub>;5】图像查询:5.1】从X<sub>test</sub>中抽取某个查询样本x<sub>q</sub>,其在Y<sub>test</sub>中对应的哈希序列为y<sub>q</sub>;分别计算y<sub>q</sub>与Y<sub>train</sub>的汉明距离后排序,生成查询样本x<sub>q</sub>对应的候选图像集X<sub>candidate</sub>;5.2】将得到的候选图像集X<sub>candidate</sub>与x<sub>q</sub>计算欧式距离后再重新排序,得到对应查询样本x<sub>q</sub>的查询结果X<sub>result</sub>,并显示出对应的图像。
地址 710119 陕西省西安市高新区新型工业园信息大道17号