发明名称 基于多特征融合的图像检索方法
摘要 本发明公开了一种基于图像多特征融合的图像检索方法,主要用于解决现有技术检索图像准确率低的问题。其实现步骤为:(1)提取待检索图像集合中所有图像的三种视觉特征和语义属性特征;(2)计算待检索图像集合中所有图像间邻接距离矩阵;(3)对查询图像在每一种特征通道进行粗检索;(4)根据每一种特征通道的粗检索结果,分析粗检索结果中图像的语义属性特征,选定参考图像;(5)根据选定的参考图像,计算每一种特征融合模板矩阵;(6)根据得到的融合模板矩阵,得到融合后的距离测度矩阵;(7)根据得到的距离测度矩阵,返回给用户检索的结果。本发明明显提高了最终图像检索的准确率,可用于图像检索。
申请公布号 CN103810299A 申请公布日期 2014.05.21
申请号 CN201410085211.X 申请日期 2014.03.10
申请人 西安电子科技大学 发明人 邓成;王嘉龙;杨延华;李洁;彭海燕;高新波
分类号 G06F17/30(2006.01)I;G06K9/66(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 陕西电子工业专利中心 61205 代理人 王品华;朱红星
主权项 1.一种基于多特征融合的图像检索方法,包括如下步骤:(1)提取图像特征:(1a)对待检索图像集合中的所有图像提取8192维视觉词袋词频BoW特征;(1b)对待检索图像集合中的所有图像提取960维GIST特征;(1c)对待检索图像集合中的所有图像提取512维HSV颜色直方图特征;(1d)通过离线训练学习,针对2659种基本语义标签,分别训练2659种语义标签的分类器,对待检索图像集合中的每幅图像,分别用这2659种分类器做预测,并将对应每一种分类器得到的预测分数连成向量,作为该图像的语义属性特征。(2)根据步骤(1a)、(1b)、(1c)得到的三种图像特征,用欧式距离公式分别计算待检索图像集合中所有图像两两之间的相似性距离,分别得到步骤(1a)对应图像特征通道的邻接距离矩阵H<sub>1</sub>'、步骤(1b)对应图像特征通道的邻接距离矩阵H'<sub>2</sub>、步骤(1c)对应图像特征通道的邻接距离矩阵H'<sub>3</sub>,每个矩阵中的每个元素值代表对应图像两两之间用对应特征计算得到的相似性距离;(3)对图像进行粗检索,并选择参考图像:(3a)根据步骤(1a)、(1b)、(1c)得到的图像特征,用欧式距离公式分别计算用户指定的查询图像和待检索图像集合中每幅图像之间在每一种特征通道上的相似性距离,构成对应三种特征通道的三组检索相似性距离向量;(3b)利用上述三种特征通道的三组检索相似性距离向量分别对步骤(2a)得到的图像邻接距离矩阵H<sub>1</sub>'、H'<sub>2</sub>、H'<sub>3</sub>进行扩展,即将对应特征通道的检索相似性距离向量添加到对应矩阵的第一行和第一列,得到分别对应所述三种特征通道的扩展后图像邻接矩阵H<sub>1</sub>、H<sub>2</sub>、H<sub>3</sub>;(3b)按照待检索图像集合中每幅待检索图像和用户给出的查询图像,将每一种特征通道的相似性距离从小到大分别排序,得到分别对应所述三种特征通道的粗检索排序列表l<sub>1</sub>、l<sub>2</sub>、l<sub>3</sub>;(3c)根据步骤(3b)得到的粗检索排序列表l<sub>1</sub>、l<sub>2</sub>、l<sub>3</sub>,选取每一个列表的前k副图像构成目标集合,对于目标集合中的每幅图像按步骤(1d)所述的语义属性特征,将小于0的维度置0,大于0的维度置1,得到目标集合中每幅图像量化后的特征向量,并将所有量化后的特征向量做平均,得到对应的语义属性共现模式向量S;(3d)利用欧氏距离公式,计算数据库中每幅待检索图像语义属性特征与上所述语义属性共现模式向量S的相似性距离,选取相似性距离最小的10幅图像作为参考图像;(4)计算特征融合模板权重矩阵:(4a)定义每一特征通道的检索结构关系函数:<maths num="0001"><![CDATA[<math><mrow><mi>Q</mi><mrow><mo>(</mo><msup><mi>w</mi><mi>m</mi></msup><mo>)</mo></mrow><mo>=</mo><msubsup><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>A</mi></msubsup><mfrac><mn>1</mn><mn>2</mn></mfrac><mrow><mo>(</mo><msubsup><mrow><mo>|</mo><mo>|</mo></mrow><msub><mi>x</mi><mi>i</mi></msub><mrow><mo>~</mo><mi>m</mi></mrow></msubsup><mo>-</mo><msubsup><mi>&Sigma;</mi><mrow><mi>j</mi><mo>&NotEqual;</mo><mi>i</mi></mrow><mi>A</mi></msubsup><msubsup><mi>w</mi><mi>ij</mi><mi>m</mi></msubsup><msubsup><mover><mi>x</mi><mo>~</mo></mover><mi>j</mi><mi>m</mi></msubsup><msubsup><mrow><mo>|</mo><mo>|</mo></mrow><mn>2</mn><mn>2</mn></msubsup><mo>+</mo><msubsup><mi>x</mi><mi>q</mi><mi>m</mi></msubsup><mo>-</mo><msubsup><mi>w</mi><mrow><mn>1</mn><mi>i</mi></mrow><mi>m</mi></msubsup><msubsup><mover><mi>x</mi><mo>~</mo></mover><mi>i</mi><mi>m</mi></msubsup><msubsup><mrow><mo>|</mo><mo>|</mo></mrow><mn>2</mn><mn>2</mn></msubsup><mo>)</mo></mrow><mo>,</mo></mrow></math>]]></maths>其中,A表示参考图像的个数,<img file="FDA0000474795730000022.GIF" wi="62" he="73" />表示第i幅参考图像的第m种特征表示,<img file="FDA0000474795730000023.GIF" wi="65" he="79" />表示第j幅参考图像的第m种特征表示,<img file="FDA0000474795730000024.GIF" wi="64" he="77" />表示用户指定的查询图像的第m种特征表示,<img file="FDA0000474795730000025.GIF" wi="64" he="71" />表示第m种特征通道对应的融合模板矩阵wm第i行第j列元素的值,||||<sub>2</sub>代表矩阵的2-范数;(4b)定义每一特征通道之间的检索结构关系函数:<maths num="0002"><![CDATA[<math><mrow><mi>R</mi><mrow><mo>(</mo><msup><mi>w</mi><mi>m</mi></msup><mo>)</mo></mrow><mo>=</mo><msubsup><mi>&Sigma;</mi><mrow><msup><mi>m</mi><mo>&prime;</mo></msup><mo>=</mo><mn>1</mn></mrow><mn>3</mn></msubsup><msubsup><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>A</mi></msubsup><msubsup><mi>&Sigma;</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mrow><mi>N</mi><mo>-</mo><mi>A</mi></mrow></msubsup><mfrac><mn>1</mn><mn>2</mn></mfrac><mrow><mo>(</mo><msubsup><mrow><mo>|</mo><mo>|</mo></mrow><msub><mi>x</mi><mi>i</mi></msub><mrow><mo>~</mo><mi>m</mi></mrow></msubsup><mo>-</mo><msubsup><mi>w</mi><mi>ik</mi><mi>m</mi></msubsup><msubsup><mi>x</mi><mi>k</mi><mi>m</mi></msubsup><msubsup><mrow><mo>|</mo><mo>|</mo></mrow><mn>2</mn><mn>2</mn></msubsup><mo>-</mo><msubsup><mrow><mo>|</mo><mo>|</mo></mrow><msub><mi>x</mi><mi>i</mi></msub><mrow><mo>~</mo><msup><mi>m</mi><mo>&prime;</mo></msup></mrow></msubsup><mo>-</mo><msubsup><mi>w</mi><mi>ik</mi><msup><mi>m</mi><mo>&prime;</mo></msup></msubsup><msubsup><mi>x</mi><mi>k</mi><msup><mi>m</mi><mo>&prime;</mo></msup></msubsup><msubsup><mrow><mo>|</mo><mo>|</mo></mrow><mn>2</mn><mn>2</mn></msubsup><mo>)</mo></mrow><mo>,</mo></mrow></math>]]></maths>其中,N表示数据库中待检索图像的个数,<img file="FDA0000474795730000027.GIF" wi="70" he="74" />表示第i幅参考图像的第m种特征表示,<img file="FDA0000474795730000028.GIF" wi="70" he="75" />表示第i幅参考图像的第m'种特征表示,<img file="FDA0000474795730000029.GIF" wi="60" he="73" />表示第k幅参考图像的第m种特征表示,<img file="FDA00004747957300000210.GIF" wi="69" he="79" />表示第k幅参考图像的第m'种特征表示,<img file="FDA00004747957300000211.GIF" wi="70" he="72" />表示第m种特征通道对应的融合模板矩阵wm第i行第k列元素的值,<img file="FDA00004747957300000212.GIF" wi="71" he="71" />表示第m'种特征通道对应的融合模板矩阵wm'第i行第k列元素的值,||||<sub>2</sub>代表矩阵的2-范数;(4c)优化如下目标函数,得到每一图像特征的融合模板矩阵{w<sup>m</sup>},m=1...3:<maths num="0003"><![CDATA[<math><mfenced open='' close=''><mtable><mtr><mtd><mi>J</mi><mo>=</mo><munder><mi>min</mi><mi>w</mi></munder><msubsup><mi>&Sigma;</mi><mrow><mi>m</mi><mo>=</mo><mn>1</mn></mrow><mi>M</mi></msubsup><mi>Q</mi><mrow><mo>(</mo><msup><mi>w</mi><mi>m</mi></msup><mo>)</mo></mrow><mo>+</mo><mi>&lambda;</mi><msubsup><mi>&Sigma;</mi><mrow><msup><mi>m</mi><mo>&prime;</mo></msup><mo>&NotEqual;</mo><mi>m</mi></mrow><mi>M</mi></msubsup><mi>R</mi><mrow><mo>(</mo><msup><mi>w</mi><mi>m</mi></msup><mo>)</mo></mrow><mo>+</mo><mi>&gamma;</mi><msubsup><mi>&Sigma;</mi><mrow><mi>m</mi><mo>=</mo><mn>1</mn></mrow><mi>M</mi></msubsup><mo>|</mo><msub><mrow><msup><mrow><mo>|</mo><mi>w</mi></mrow><mi>m</mi></msup><mo>|</mo><mo>|</mo></mrow><mn>1</mn></msub><mo>,</mo></mtd></mtr><mtr><mtd><mi>s</mi><mo>.</mo><mi>t</mi><mo>.</mo><msub><mi>&Sigma;</mi><mi>j</mi></msub><msub><mi>w</mi><mi>ij</mi></msub><mo>=</mo><mn>1</mn><mo>,</mo><msub><mi>w</mi><mi>ij</mi></msub><mo>&GreaterEqual;</mo><mn>0</mn></mtd></mtr></mtable></mfenced></math>]]></maths>其中,λ和γ分别是给定的常数,||||<sub>1</sub>代表矩阵的1-范数;(5)图像精检索:(5a)根据步骤(3a)得到的图像邻接距离矩阵H<sub>1</sub>、H<sub>2</sub>、H<sub>3</sub>及步骤(4c)得到的每一种图像特征的融合模板矩阵{w<sup>m</sup>},计算融合后的图像邻接矩阵H:<maths num="0004"><![CDATA[<math><mrow><mi>H</mi><mo>=</mo><msub><mi>&Sigma;</mi><mi>m</mi></msub><msup><mi>w</mi><mi>m</mi></msup><mo>&CircleTimes;</mo><msub><mi>H</mi><mi>m</mi></msub><mo>,</mo><mi>m</mi><mo>=</mo><mn>1</mn><mo>.</mo><mo>.</mo><mo>.</mo><mn>3</mn><mo>,</mo></mrow></math>]]></maths>其中,w<sup>m</sup>表示第m种特征通道对应的融合模板矩阵,<img file="FDA0000474795730000033.GIF" wi="39" he="44" />代表矩阵的模板点乘运算;(5b)根据融合后的图像邻接矩阵H,按照其第一行的值从小到大排列,将得到排列结果的前k幅图像作为检索结果返回给用户。
地址 710071 陕西省西安市太白南路2号