发明名称 一种自适应多特征融合的图像特征学方法
摘要 本发明公开一种自适应多特征融合的图像特征学方法。该方法依据L1范数具有自动数据样本选择的特性,首先从图像上分别提取多种类型的图像视觉特征,接着对每一种视觉特征分别采用L1范数约束的数据稀疏表达,构建有向L1图并最下化各种特征数据在低维空间上的重建误差,其次引入特征权重向量对所有特征做全局坐标对齐操作,得到自适应多特征融合的图像特征学方法的目标函数,最后求解该目标函数,可以从原始多种图像特征基础上学得到最优的图像低维特征表达。将本方法所得到的图像低维特征表达作为最近邻分类器算法的输入,在公共图像数据集Corel5K和NUS-WIDE-OBJECT上与其他算法比较,分类准确率分别提高5%和2%,因此该方法所得到的图像特征具有较强的表达能力。
申请公布号 CN103426006A 申请公布日期 2013.12.04
申请号 CN201310342023.6 申请日期 2013.08.07
申请人 浙江商业职业技术学院 发明人 毛金莲
分类号 G06K9/66(2006.01)I 主分类号 G06K9/66(2006.01)I
代理机构 杭州求是专利事务所有限公司 33200 代理人 张法高
主权项 1.一种自适应多特征融合的图像特征学习方法,其特征在于包括如下步骤:1)从N幅图像上分别提取K种类型的图像视觉特征<img file="FDA00003634054100011.GIF" wi="290" he="78" /><img file="FDA00003634054100012.GIF" wi="539" he="77" />其中<img file="FDA00003634054100013.GIF" wi="40" he="68" />为第i幅图像上所提取的第v种类型的视觉特征;2)依据L1范数具有自动数据特征选择的特性,对每一种视觉特征分别采用L1范数约束的数据稀疏表达:<maths num="0001"><![CDATA[<math><mrow><mi>min</mi><msubsup><mrow><mo>|</mo><mo>|</mo><msubsup><mi>x</mi><mi>i</mi><mi>v</mi></msubsup><mo>-</mo><msup><mi>X</mi><mi>v</mi></msup><msubsup><mi>w</mi><mi>i</mi><mi>v</mi></msubsup><mo>|</mo><mo>|</mo></mrow><mi>F</mi><mn>2</mn></msubsup><mo>+</mo><mi>&lambda;</mi><msub><mrow><mo>|</mo><mo>|</mo><msubsup><mi>w</mi><mi>i</mi><mi>v</mi></msubsup><mo>|</mo><mo>|</mo></mrow><mn>1</mn></msub></mrow></math>]]></maths>        1<maths num="0002"><![CDATA[<math><mrow><mi>s</mi><mo>.</mo><mi>t</mi><mo>.</mo><msubsup><mi>w</mi><mi>ii</mi><mi>v</mi></msubsup><mo>=</mo><mn>0</mn></mrow></math>]]></maths>根据计算得到的<img file="FDA00003634054100016.GIF" wi="66" he="69" />构建有向L1图g<sup>v</sup>={X<sup>v</sup>,W<sup>v</sup>},其中该类型图像特征X<sup>v</sup>构成图的顶点,图的边的权重<img file="FDA00003634054100017.GIF" wi="361" he="71" />最下化各种特征下的数据在低维空间上的重建误差:<maths num="0003"><![CDATA[<math><mrow><munder><mi>min</mi><msup><mi>Y</mi><mi>v</mi></msup></munder><msubsup><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></msubsup><msubsup><mrow><mo>|</mo><mo>|</mo><msubsup><mi>Y</mi><mi>i</mi><mi>v</mi></msubsup><mo>-</mo><msup><mi>Y</mi><mi>v</mi></msup><msubsup><mi>w</mi><mi>i</mi><mi>v</mi></msubsup><mo>|</mo><mo>|</mo></mrow><mn>2</mn><mn>2</mn></msubsup><mo>-</mo><mo>-</mo><mo>-</mo><mn>2</mn></mrow></math>]]></maths>3)引入特征权重向量α=[α<sub>1</sub>,...,α<sub>K</sub>],对所有特征做全局坐标对齐操作,得到自适应多特征融合的图像特征学习方法目标函数如下:<maths num="0004"><![CDATA[<math><mrow><munder><mi>min</mi><mrow><mi>&alpha;</mi><mo>,</mo><mi>Y</mi></mrow></munder><msubsup><mi>&Sigma;</mi><mrow><mi>v</mi><mo>=</mo><mn>1</mn></mrow><mi>K</mi></msubsup><msup><mrow><mo>(</mo><msub><mi>&alpha;</mi><mi>v</mi></msub><mo>)</mo></mrow><mi>r</mi></msup><msubsup><mrow><msubsup><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></msubsup><mrow><mo>|</mo><mo>|</mo><mi>Y</mi><mo>-</mo><mi>Y</mi><msubsup><mi>w</mi><mi>i</mi><mi>v</mi></msubsup><mo>|</mo><mo>|</mo></mrow></mrow><mn>2</mn><mn>2</mn></msubsup></mrow></math>]]></maths>      3<maths num="0005"><![CDATA[<math><mrow><mi>s</mi><mo>.</mo><mi>t</mi><mo>.</mo><msup><mi>YY</mi><mi>T</mi></msup><mo>=</mo><mi>I</mi><mo>,</mo><msubsup><mi>&Sigma;</mi><mrow><mi>v</mi><mo>=</mo><mn>1</mn></mrow><mi>K</mi></msubsup><msub><mi>&alpha;</mi><mi>v</mi></msub><mo>=</mo><mn>1</mn><mo>,</mo><msub><mi>&alpha;</mi><mi>v</mi></msub><mo>&GreaterEqual;</mo><mn>0</mn><mo>,</mo><mo>&ForAll;</mo><mi>v</mi></mrow></math>]]></maths>其中,r为开方次数参数;4)对上面目标函数3进行优化求解,采用拉格朗日乘法,得到计算公式如下:<maths num="0006"><![CDATA[<math><mrow><msub><mi>&alpha;</mi><mi>v</mi></msub><mo>=</mo><mfrac><mrow><mo>(</mo><mn>1</mn><mo>/</mo><mi>tr</mi><msup><mrow><mo>(</mo><msup><mi>YG</mi><mi>v</mi></msup><msup><mi>Y</mi><mi>T</mi></msup><mo>)</mo></mrow><mrow><mn>1</mn><mo>/</mo><mrow><mo>(</mo><mi>r</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow></mrow></msup><mo>)</mo></mrow><mrow><msubsup><mi>&Sigma;</mi><mrow><mi>v</mi><mo>=</mo><mn>1</mn></mrow><mi>K</mi></msubsup><mrow><mo>(</mo><mn>1</mn><mo>/</mo><mi>tr</mi><msup><mrow><mo>(</mo><msup><mi>YG</mi><mi>v</mi></msup><msup><mi>Y</mi><mi>T</mi></msup><mo>)</mo></mrow><mrow><mn>1</mn><mo>/</mo><mrow><mo>(</mo><mi>r</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow></mrow></msup><mo>)</mo></mrow></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mn>4</mn></mrow></math>]]></maths>Y=select_svd(G,d)            5其中:tr(·)为矩阵求迹运算,G<sup>v</sup>=(I-W<sup>v</sup>)(I-W<sup>v</sup>)<sup>T</sup>,<img file="FDA000036340541000112.GIF" wi="402" he="102" />select_svd(G,d)表示对G做特征值分解并取特征值最小的前d个特征值所对应的特征向量,构成矩阵,Y即为从原始多种图像特征基础上所学习得到的图像最优的低维特征表达。
地址 310053 浙江省杭州市滨江区滨文路470号