发明名称 基于半监督哈希的图像检索方法
摘要 本发明公开了一种基于半监督哈希的图像检索方法,主要解决现有技术检索速度慢、占用内存空间大、检索结果不精确的问题。其实现步骤为:(1)提取原始图像的底层特征,并对其作归一化处理;(3)将归一化数据分为训练数据和测试数据;(4)使用类标传递方法求训练数据的类标,根据类标产生编码;(5)使用训练数据及其编码训练支持向量机分类器;(6)使用支持向量机分类器对训练数据和测试数据分类,根据分类结果产生训练数据和测试数据的编码;(7)根据训练数据编码和测试数据编码之间的汉明距离得到检索结果。本发明降低了内存消耗,节省了检索时间,提高了图像检索的准确性,可用于电子商务和移动终端设备的图片搜索服务。
申请公布号 CN104182538A 申请公布日期 2014.12.03
申请号 CN201410441091.2 申请日期 2014.09.01
申请人 西安电子科技大学 发明人 李洁;高宪军;王秀美;刘卫芳;邓成;王颖;寒冰;王斌;路文
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 陕西电子工业专利中心 61205 代理人 王品华;朱红星
主权项 一种基于半监督哈希的图像检索方法,包括如下步骤:(1)从图像数据库中提取10000张原始图像,对每一张原始图像提取局部空间约束的全局频率特征,得到每一张图像的特征数据;(2)对每一张图像的特征数据做归一化处理,得到归一化数据;(3)将所有图像的归一化数据随机分成三部分:已标记的训练数据L、未标记的训练数据U、测试数据T,并对已标记的训练数据L标记类标H<sub>L</sub>,将已标记的训练数据L和未标记的训练数据U组合得到训练数据矩阵X;(4)根据训练数据矩阵X和已标记的训练数据的类标H<sub>L</sub>,使用类标传递方法求得未标记训练数据U的类标H<sub>U</sub>,将已标记的训练数据的类标H<sub>L</sub>和未标记训练数据的类标H<sub>U</sub>组合得到训练数据矩阵的类标H;(5)根据训练数据矩阵X及训练数据矩阵的类标H产生更新的训练数据的编码B′;(6)使用训练数据矩阵X和更新的训练数据的编码B′对K个支持向量机分类器进行训练,其中K表示编码位数;(7)使用训练得到的K个支持向量机分类器对训练数据X和测试数据T进行分类,根据分类结果得到训练数据X的哈希码C<sub>X</sub>和测试数据T的哈希码C<sub>T</sub>;(8)从测试数据的哈希码C<sub>T</sub>中取一个测试数据的哈希码t,计算该哈希码t与训练数据的哈希码C<sub>T</sub>之间的汉明距离,得到汉明距离向量;(9)对汉明距离向量中的数值按从小到大的顺序进行排序,按顺序输出对应的原始图像,得到检索结果。
地址 710071 陕西省西安市太白南路2号