发明名称 一种基于关系矩阵正则化增强表示的图像检索方法
摘要 本发明公开了一种基于关系矩阵正则化增强方法从图像实例库中检索图像的方法,包含如下步骤:步骤1,输入待检索图像;步骤2,抽取待检索图像和图像实例库中图像的特征;步骤3,从图像实例特征库中选取P个图像类,从每一个图像类选取n幅图像构成样本数据X;步骤4,基于谱图理论的流形学算法,对样本数据X构建三个矩阵;步骤5,初步建立增强关系矩阵W′;步骤6,计算正则化增强关系矩阵W<sup>*</sup>;步骤7,计算广义特征矩阵A;步骤8,计算最终的图像表示;步骤9,计算待检索图像的图像表示;步骤10,采用欧氏距离计算待检索图像与图像实例库中所有图像的相似度,按照相似度由大到小输出图像实例库中与待检索图像最相似的图像。
申请公布号 CN103440332B 申请公布日期 2016.08.17
申请号 CN201310399734.7 申请日期 2013.09.05
申请人 南京大学 发明人 杨育彬;李亚楠
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 江苏圣典律师事务所 32237 代理人 胡建华
主权项 一种基于关系矩阵正则化增强表示的图像检索方法,其特征在于,该方法从图像实例库中检索图像,包含如下步骤:步骤1,输入待检索图像;步骤2,抽取待检索图像和图像实例库中图像的特征,用N维向量描述每幅图像,N=112,得到图像实例特征库以及待检索图像的特征,所述图像实例库包括50个以上的图像类,每一个图像类表示一个语义类,每个图像类包括600幅以上的图像;步骤3,从图像实例特征库中选取P个图像类,P取值范围20~50,从每一个图像类选取n幅图像,n取值范围100~500,P个图像类共有n×P张图像构成样本数据X;步骤4,基于谱图理论的流形学习算法,对样本数据X构建关系矩阵W、正例关系矩阵W<sup>P</sup>和反例关系矩阵W<sup>N</sup>;步骤5,对构建的关系矩阵W进行增强,初步建立增强关系矩阵W′;步骤6,借助概率转移矩阵正则化增强关系矩阵W<sup>′</sup>得到正则化增强关系矩阵W<sup>*</sup>:步骤7,根据正则化增强关系矩阵W<sup>*</sup>构建目标方程,计算广义特征矩阵A;步骤8,利用广义特征矩阵A对图像实例特征库中的所有图像进行降维,得到最终的图像表示;步骤9,利用广义特征矩阵A对待检索图像降维,得到待检索图像的图像表示;步骤10,根据步骤8的最终的图像表示和步骤9的待检索图像的图像表示的欧氏距离计算待检索图像与图像实例库中所有图像的相似度,按照相似度由大到小输出图像实例库中与待检索图像最相似的图像;步骤2中图像特征包括颜色矩、Tamura纹理特征、Gabor纹理特征、颜色直方图;步骤4具体包括如下步骤:在样本数据X中随机选取一幅图像,计算该图像与样本数据X中其他图像的欧式距离,利用相关反馈检索技术,根据返回结果中的同类图像和不同类图像对应设立正例集合和反例集合,并采用简单的k近邻方法建立关系矩阵,即属于k近邻并且是同一个图像类的两图像间的权值为1,否则为0;步骤4中采用基于反馈技术的嵌入关系拓宽ARE方法作为谱图理论的流形学习算法,包括以下步骤:(1)首先对样本数据X构建关系矩阵W,从样本数据X中随机抽取一幅图像I,图像I的特征为x<sub>i</sub>,采用k近邻方法计算x<sub>i</sub>与样本数据X中其他图像特征的欧式距离,得到与图像I最相似的k幅图像,其中k取值范围5~10;从k幅图像中任意取出一幅图像T,图像T的特征为x<sub>t</sub>,则图像I与图像T之间的权值W<sub>it</sub>为1,图像I与k幅图像以外的图像之间的权值为0;即x<sub>i</sub>∈N<sup>k</sup>(x<sub>t</sub>)or x<sub>t</sub>∈N<sup>k</sup>(x<sub>i</sub>),W<sub>it</sub>=1,其中N<sup>k</sup>(x<sub>i</sub>)表示图像x<sub>i</sub>的k近邻集合,N<sup>k</sup>(x<sub>t</sub>)表示图像x<sub>t</sub>的k近邻集合;得到关系矩阵W,关系矩阵W第i行第t列的值即为W<sub>it</sub>;将k幅图像中与图像I属于同一图像类的图像记为正例集合Pos,不同图像类的图像记为反例集合Neg;(2)构建正例关系矩阵W<sup>P</sup>,如果图像R与图像I属于同一图像类且都属于k幅图像,且图像R的特征为x<sub>r</sub>,则图像I与图像R之间的权值为1,图像I与k幅图像以外的图像之间的权值为0;即,x<sub>i</sub>,x<sub>r</sub>∈Pos,<img file="FDA0001008118400000021.GIF" wi="211" he="71" /><img file="FDA0001008118400000022.GIF" wi="78" he="71" />为图像I与图像R之间的权值,x<sub>i</sub>,x<sub>r</sub>∈Pos为表示特征x<sub>i</sub>,x<sub>r</sub>属于正例集合Pos,正例关系矩阵W<sup>P</sup>的第i行第r列的值即为<img file="FDA0001008118400000023.GIF" wi="97" he="70" />公式为:<img file="FDA0001008118400000024.GIF" wi="534" he="141" />(3)构建反例关系矩阵W<sup>N</sup>,如果图像H与图像I属于不同图像类且都属于k幅图像,图像H的特征为x<sub>h</sub>,则图像I与图像H之间的权值为1,图像I与k幅图像以外的图像之间的权值为0;即x<sub>i</sub>∈Pos and x<sub>h</sub>∈Neg,or x<sub>h</sub>∈Pos and x<sub>i</sub>∈Neg,<img file="FDA0001008118400000025.GIF" wi="195" he="70" />x<sub>i</sub>∈Pos表示特征x<sub>i</sub>属于正例集合Pos,x<sub>h</sub>∈Neg表示特征x<sub>h</sub>属于反例集合Neg,x<sub>h</sub>∈Pos表示特征x<sub>h</sub>属于正例集合Pos,x<sub>i</sub>∈Neg表示特征x<sub>i</sub>属于反例集合Neg,<img file="FDA0001008118400000026.GIF" wi="78" he="70" />为图像I与图像H之间的权值,反例关系矩阵W<sup>N</sup>的第i第h列为<img file="FDA0001008118400000027.GIF" wi="99" he="71" />公式为:<img file="FDA0001008118400000028.GIF" wi="1294" he="142" />最后构建得到三个关系矩阵W,W<sup>P</sup>和W<sup>N</sup>。
地址 210093 江苏省南京市汉口路22号南京大学