发明名称 一种海量图片快速检索方法
摘要 本发明提出了一种新的海量图片快速检索方法,包括以下几个方面一是通过把RGB颜色空间的图片转化到HSV颜色空间,二是通过把图片空间分块,分别提取各个小块的HSV颜色直方图信息,三是使用谱哈希算法得到图片的索引特征,四是对使用谱哈希索引特征检索返回的相似图片集,使用原始的HSV颜色空间分块颜色直方图特征,采用街区距离作为图像之间相似性度量的函数,对基于谱哈希生成的索引特征返回的相似图片集进行重新排序,实验证明,与以往算法相比,本发明提出的算法能准确实时的处理百万规模的图片数据,这种方法能够用于互联网基于内容的图片检索,在线电子购物网站等场景中。
申请公布号 CN102819582B 申请公布日期 2014.10.08
申请号 CN201210261642.8 申请日期 2012.07.26
申请人 华数传媒网络有限公司;北京数视宇通技术有限公司 发明人 王海;赵志峰;张卫;单炳云;刘杰
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 杭州裕阳专利事务所(普通合伙) 33221 代理人 江助菊
主权项 一种海量图片快速检索方法,其特征在于,包括如下步骤:11)首先把图片从RGB颜色空间转化到HSV颜色空间,然后对HSV颜色空间的三个通道H,S,V分别均匀量化为12,2,2个区间,使其量化成48种颜色;包括如下步骤:HSV颜色空间的三个通道H,S,V通道分别量化的数量为HBin,SBin和VBin,取HBin=12,SBin=2,VBin=2,使用三个整数值HValue,SValue,和VValue代表三个通道每个数值落入的小区间的标号,其中0&lt;=HValue&lt;=HBin‑1,0&lt;=SValue&lt;=SBin‑1,0&lt;=VValue&lt;=VBin‑1,使用以下公式计算最终要生成的颜色直方图的标号,这个最终颜色直方图的标号用Bin表示,Bin=HValue*SBin*VBin+SValue*VBin+VValue,Bin的取值范围是0&lt;=Bin&lt;=47,即一幅图片的直方图表示成了48维度的直方图;对图片按照水平和垂直的方向分别平均的分成两个小块,分别把每一个小块当做一张图片,计算上面的HSV颜色直方图的统计信息,使得每一个小块生成48维度的颜色特征,把4个小块的颜色特征从上到下,从左到右,结合成一个一维的特征向量,这样一张图片就会生成48*4=192维度的特征向量;12)使用谱哈希算法把原始的HSV颜色空间分块颜色直方图192维度的特征向量嵌入到二进制空间,得到二进制索引特征;包括如下步骤:一个图片集特征向量的集合{x<sub>i</sub>},每一个特征向量x<sub>i</sub>是d维度空间的一个样本点,使用谱哈希算法将原始的特征向量嵌入到二进制空间中,使得新生成的特征向量用k位0或者1的比特位表示,所述谱哈希算法包括如下步骤:121)使用主成分分析算法得到数据集{x<sub>i</sub>}的各个主成分分量;122)在每一维度主成分分析算法主方向上,使用公式(1)计算k个最小单一维度的特征函数,在计算每一维度特征函数的时候可以通过假定数据是分布在区间[a,b]上的均匀分布来简化计算,这样得到了k×d个特征值,对这些特征值进行排序保留k个最小的特征值;<img file="FDA0000537126880000011.GIF" wi="662" he="142" /><maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>&lambda;</mi><mi>j</mi></msub><mo>=</mo><mn>1</mn><mo>-</mo><msup><mi>e</mi><mrow><mo>-</mo><mfrac><msup><mi>&epsiv;</mi><mn>2</mn></msup><mn>2</mn></mfrac><mo>|</mo><mfrac><mrow><mi>j</mi><mo>&times;</mo><mi>&pi;</mi></mrow><mrow><mi>b</mi><mo>-</mo><mi>a</mi></mrow></mfrac><msup><mo>|</mo><mn>2</mn></msup></mrow></msup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000537126880000021.GIF" wi="620" he="183" /></maths>所述公式(1)计算的是变量x第j维度的特征函数<img file="FDA0000537126880000022.GIF" wi="72" he="128" />其中的参数含义如下:π代表圆周率,j是特征向量维度的标号,x表示的是特征向量在第j维度的取值,其中a和b代表了x的取值范围,也就是a&lt;=x&lt;=b;公式(2)计算的是变量x第j维度的特征值,其中ε定义了在高维空间中两个相似点之间的距离;123)以0为阈值对特征函数进行量化,即<img file="FDA0000537126880000023.GIF" wi="150" he="120" />得到的最终比特位为1,否则得到最终的比特位为0;13)使用汉明距离计算待查询图像二进制索引特征和数据库中所有图片的二进制索引特征的距离,返回汉明距离小于一个阈值T的所有图片作为相似图片集,包括如下步骤:使用公式<img file="FDA0000537126880000024.GIF" wi="449" he="95" />计算待查询图像二进制索引特征和数据库中所有图片的二进制索引特征的距离;其中,<img file="FDA0000537126880000026.GIF" wi="53" he="53" />代表模2加法运算,x和y都是长度为k由0或者1组成的二进制索引特征向量,即x<sub>i</sub>∈{0,1},y<sub>i</sub>∈{0,1},k代表了特征向量x,和y的二进制位数;14)对步骤13)采用二进制索引特征返回的相似图片集中的每一幅图像,依次计算待查询图像原始HSV颜色空间分块颜色直方图特征和相似图片集中的每一幅图像对应的原始HSV颜色空间分块颜色直方图特征的街区距离,并对所有的距离排序,并且按照距离的排序返回查询图片的目标结果集,包括如下步骤:使用公式<img file="FDA0000537126880000025.GIF" wi="448" he="94" />计算待查询图像原始HSV颜色空间分块颜色直方图特征和相似图片集中的每一幅图像对应的原始HSV颜色空间分块颜色直方图特征的街区距离,并对所有的距离排序,并且按照距离的排序返回查询图片的目标结果集;其中d代表了原始HSV颜色空间分块颜色直方图特征向量x和y的维度;对每一个颜色的出现频率开根号作为该维度的特征,最后的这192维度的的特征向量的每一个维度除以这张图片的总的像素个数作为最后的HSV颜色空间分块颜色直方图特征向量。
地址 310013 浙江省杭州市西湖区莲花街333号莲花商务中心A座8楼