发明名称 基于互训练的流形对图像资源和文字进行融合的方法
摘要 基于互训练的流形对图像资源和文字进行融合的方法,涉及图像检索和模式识别技术。它解决了现有的图像检索方法存在的检索精度较差的问题。本发明的步骤为:步骤一、根据图像资源和文字特征构建原始流形;步骤二、通过ISOMAP方法对原始流形进行降维处理,得到低维拓扑结构以及相似性度量s<sup>t</sup>(x,y),t的初始值为0;步骤三、对低维拓扑结构进行相似度迭代,得到两幅图像间的相似度;步骤四、根据两幅图像的相似度得到两幅图像样本点之间的收缩率;步骤五、根据步骤四得到的收缩率,对流形进行收缩调整;步骤六、若得到的流形收敛,则融合结束;若得到的流形不收敛,则令t=t+1,并返回执行步骤二。本发明适用于图像处理和图像检索领域。
申请公布号 CN101430690A 申请公布日期 2009.05.13
申请号 CN200810137509.5 申请日期 2008.11.12
申请人 哈尔滨工业大学 发明人 姚鸿勋;刘先明;纪荣嵘;许鹏飞;孙晓帅;刘天强
分类号 G06F17/30(2006.01)I;G06K9/64(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 哈尔滨市松花江专利商标事务所 代理人 牟永林
主权项 1、基于互训练的流形对图像资源和文字进行融合的方法,其特征在于它的步骤为:步骤一、根据图像资源和文字特征构建原始流形;步骤二、通过ISOMAP方法对原始流形进行降维处理,得到低维拓扑结构以及相似性度量st(x,y),t的初始值为0;步骤三、对低维拓扑结构进行相似度迭代,得到两幅图像间的相似度:<maths num="0001"><![CDATA[<math><mrow><mi>h</mi><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>=</mo><msup><mi>s</mi><mrow><mi>t</mi><mo>+</mo><mn>1</mn></mrow></msup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>=</mo><mi>exp</mi><mrow><mo>(</mo><mo>-</mo><mfrac><mrow><msup><mi>d</mi><mn>2</mn></msup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></mrow><mrow><mi>&mu;</mi><mo>&CenterDot;</mo><msup><mi>s</mi><mi>t</mi></msup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></mrow></mfrac><mo>)</mo></mrow></mrow></math>]]></maths>其中,d<sup>2</sup>(x,y)表示第t次迭代和第t+1次迭代在所对应的视觉特征空间中的L2距离,μ为控制归一化的常数;步骤四、根据图像i和图像j的相似度得到两幅图像样本点之间的收缩率:<maths num="0002"><![CDATA[<math><mrow><msup><mi>&rho;</mi><mi>t</mi></msup><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>=</mo><mi>exp</mi><mrow><mo>(</mo><mfrac><mrow><msup><mi>s</mi><mrow><mi>t</mi><mo>+</mo><mn>1</mn></mrow></msup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></mrow><mrow><msup><mi>s</mi><mi>t</mi></msup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></mrow></mfrac><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>-</mo><mn>1</mn><mo>;</mo></mrow></math>]]></maths>步骤五、根据步骤四得到的收缩率,使用下面的公式对流形进行收缩调整<maths num="0003"><![CDATA[<math><mrow><mover><msub><mi>K</mi><mi>i</mi></msub><mi>V</mi></mover><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>=</mo><mrow><mfenced open='{' close='' separators=','><mtable><mtr><mtd><mover><msub><mi>K</mi><mi>i</mi></msub><mi>V</mi></mover><mrow><mo>(</mo><mi>t</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>+</mo><munder><mi>&Sigma;</mi><mrow><mi>j</mi><mo>&Element;</mo><mi>X</mi></mrow></munder><mrow><mo>[</mo><mrow><mo>(</mo><mover><msub><mi>K</mi><mi>j</mi></msub><mi>V</mi></mover><mrow><mo>(</mo><mi>t</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>-</mo><mover><msub><mi>K</mi><mi>i</mi></msub><mi>V</mi></mover><mrow><mo>(</mo><mi>t</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>)</mo></mrow><mo>&CenterDot;</mo><msup><mi>&rho;</mi><mi>t</mi></msup><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>]</mo></mrow></mtd><mtd><mi>t</mi><mo>></mo><mn>1</mn></mtd></mtr><mtr><mtd><mover><msub><mi>K</mi><mi>i</mi></msub><mi>V</mi></mover></mtd><mtd><mi>t</mi><mo>=</mo><mn>0</mn></mtd></mtr></mtable></mfenced></mrow></mrow></math>]]></maths>其中<img file="A200810137509C00024.GIF" wi="42" he="67" />表示图像i在特征空间中所对应的特征向量;X表示在步骤二中得到的拓扑结构上与图像i所对应点邻接的图像集合,则<img file="A200810137509C00025.GIF" wi="165" he="73" />表示的是在t-1次迭代时与之相邻接的图像在特征空间中的特征向量;步骤六、若得到的流形收敛,则融合结束;若得到的流形不收敛,则令t=t+1,并返回执行步骤二。
地址 150001黑龙江省哈尔滨市南岗区西大直街92号