发明名称 一种融合空间信息的Bag of Words图像检索方法
摘要 本发明涉及一种融合空间信息的Bag of Words图像检索方法,技术特征在于:考虑到图像所包含的内容都是现实世界的物体,物体都具有一定的形状和结构特征,融入显著特征区域的空间信息便可以更加形象、准确的描述图像所包含的内容,从而能够得到更好的图像检索效果。利用Bag of Words对图像进行很好的描述,可以获得图像在图像空间基上的向量表示,通过特征区域空间信息的加入,可以很好的保证了图像底层特征区域之间的结构信息,从而提高了图像的检索精度。因此,融合特征区域空间信息的Bag of Words图像检索方法,更加适用于图像的检索。
申请公布号 CN102117337A 申请公布日期 2011.07.06
申请号 CN201110081331.9 申请日期 2011.03.31
申请人 西北工业大学 发明人 韩军伟;郭雷;刘天明;胡新韬;许明
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 西北工业大学专利中心 61204 代理人 王鲜凯
主权项 1.一种融合空间信息的Bag of Words图像检索方法,其特征在于步骤如下:步骤1:提取数据库中每幅图像的SIFT特征,得到每幅图像底层特征的集合I={p<sub>m</sub>|m=1...|I|},其中p<sub>m</sub>=(f<sub>m</sub>,X<sub>m</sub>,λ<sub>m</sub>,θ<sub>m</sub>),|I|为图像I中SIFT特征区域数目,f<sub>m</sub>为特征区域128维的特征描述向量、X<sub>m</sub>为特征区域中心所在位置、λ<sub>m</sub>为特征区域尺度信息、θ<sub>m</sub>为特征区域的主方向角度信息;步骤2:利用Hierarchical K-means聚类算法对图像数据库中的所有图像所提取的特征区域的特征描述向量f<sub>m</sub>进行聚类,其中聚类数目K∈[10000,1000000],得到聚类中心的类别的标号w及聚类的层次树结构Tree,形成底层特征p′<sub>m</sub>=(w<sub>m</sub>,X<sub>m</sub>,λ<sub>m</sub>,θ<sub>m</sub>),所述的w<sub>m</sub>∈w为特征区域所属的聚类中心类别的标号;步骤3:计算图像每个底层特征p′<sub>m</sub>的<img file="FSA00000463493100011.GIF" wi="425" he="144" />和Δθ<sub>mn</sub>=||θ<sub>m</sub>-θ<sub>n</sub>||,得到ΔX<sub>m</sub>={ΔX<sub>mn</sub>|n=1,2,...,|I|,n≠m}和Δθ<sub>m</sub>=(Δθ<sub>mn</sub>|n=1,2,...,|I|,n≠m),将[0,2π]等分成数个均匀方向区域,在每个均匀方向区域上,计算Δθ<sub>m</sub>中属于该方向区域上的集合Δθ′<sub>m</sub>={Δθ<sub>mi</sub>|i=a<sub>1</sub>,...,a<sub>k</sub>}所对应的集合ΔX′<sub>m</sub>={ΔX<sub>mi</sub>|i=a<sub>1</sub>,...,a<sub>k</sub>}中最小值对应的特征区域的类别标号w<sub>i</sub>,其中<img file="FSA00000463493100012.GIF" wi="554" he="56" /><img file="FSA00000463493100013.GIF" wi="730" he="58" />得到底层特征p″<sub>m</sub>=(w<sub>m</sub>,sw<sub>m</sub>);所述的下标mn分别表示图像中第m个特征区域与第n个特征区域,所述的sw<sub>m</sub>为数个均匀方向区域上选取的w<sub>i</sub>组成的向量;步骤4:图像数据库中的每幅图像T的底层特征的集合表示t={p″<sub>m</sub>|m=1,2,...|T|},其中p″<sub>m</sub>=(w<sub>m</sub>,sw<sub>m</sub>);步骤5:计算待查询图像目标区域Q的底层特征的集合q={p″<sub>o</sub>|o=1,2,...|Q|},其中p″<sub>o</sub>=(w<sub>o</sub>,sw<sub>o</sub>),待查询图像目标区域特征p,p′,p″均以下标o表示,与图像数据库中下标m加以区分,具体步骤如下:步骤a:提取以待查询图像目标区域的底层SIFT特征,得到以待查询图像目标区域Q的底层特征集合q={p<sub>o</sub>|o=1...|Q|},其中p<sub>o</sub>=(f<sub>o</sub>,X<sub>o</sub>,λ<sub>o</sub>,θ<sub>o</sub>);步骤b:利用步骤2生成的聚类层次树结构Tree,查找每个f<sub>o</sub>对应的类别标号w<sub>o</sub>,得到以待查询图像目标区域Q的底层特征集合q={p′<sub>o</sub>|o=1,2,...|Q|},其中p′<sub>o</sub>=(w<sub>o</sub>,X<sub>o</sub>,λ<sub>o</sub>,θ<sub>o</sub>),w<sub>o</sub>∈w;步骤c:对以待查询图像目标区域q={p′<sub>o</sub>|o=1,2,...|Q|},分别选取q中的每个底层特征p′<sub>o</sub>计算<img file="FSA00000463493100021.GIF" wi="411" he="144" />和Δθ<sub>on</sub>=||θ<sub>o</sub>-θ<sub>n</sub>||,得到ΔX<sub>o</sub>={ΔX<sub>on</sub>|n=1,2,...,|I|,n≠o}和Δθ<sub>o</sub>=(Δθ<sub>on</sub>|n=1,2,...,|I|,n≠o),将[0,2π]等分成数个均匀方向区域,在每个均匀方向区域上,计算Δθ<sub>o</sub>中属于该方向区域上的集合Δθ′<sub>o</sub>={Δθ<sub>oi</sub>|i=a<sub>1</sub>,...,a<sub>k</sub>}所对应的集合ΔX′<sub>o</sub>={ΔX<sub>oi</sub>|i=a<sub>1</sub>,...,a<sub>k</sub>}中最小值对应的特征区域的类别标号w<sub>o</sub>,其中<img file="FSA00000463493100022.GIF" wi="519" he="57" /><img file="FSA00000463493100023.GIF" wi="731" he="60" />得到底层特征p<sub>o</sub>″=(w<sub>o</sub>,sw<sub>o</sub>);,得到以待查询图像底层特征集合q={p″<sub>o</sub>|o=1,2,...|Q|},其中p″<sub>o</sub>=(w<sub>o</sub>,sw<sub>o</sub>);步骤6:计算以待查询图像目标区域Q与图像数据库中每幅图像T之间的相似度,具体步骤如下:步骤(a):依次取图像数据库中的每幅图像t={p″<sub>m</sub>|m=1,2,...|T|};步骤(b):对q中的每个元素p″<sub>o</sub>,判断t中是否存在非空子集mt,使其满足<img file="FSA00000463493100024.GIF" wi="455" he="53" />步骤(c):如果存在非空子集mt,则计算sw<sub>o</sub>与mt中每个sw<sub>m</sub>的相似度<img file="FSA00000463493100025.GIF" wi="734" he="115" />得到S_temp={S_temp(m)|m∈{s<sub>1</sub>,s<sub>2</sub>,....s<sub>k</sub>}},其中<img file="FSA00000463493100026.GIF" wi="368" he="59" />所述的H(·)为汉明距离,所述的D为sw<sub>o</sub>的向量长度;步骤(d):计算以待查询图像目标区域Q与数据库中每幅图像T之间的<img file="FSA00000463493100031.GIF" wi="660" he="127" />所述S<sub>s</sub>(Q,T)为对每个元素(w<sub>o</sub>,sw<sub>o</sub>)生成的S_temp进行max(S_temp)求和,所述的S<sub>w</sub>(Q,T)为每个元素(w<sub>o</sub>,sw<sub>o</sub>)生成的S_temp进行max(S_temp)>0数目求和,所述|T|为图像特征区域的数目;步骤7:将以待查询图像目标Q与数据库中每幅图像T之间的S(Q,T)按降序排列,按相似度大小依次在图像库中选取所对应的图像。
地址 710072 陕西省西安市友谊西路127号
您可能感兴趣的专利