发明名称 一种求解二次图匹配模型的方法
摘要 一种求解二次图匹配模型的方法,该方法在给定图匹配模型和容忍满足所有约束条件的图像匹配矩阵时,首先在容忍满足等式约束的条件计算图匹配目标函数的上升方向,然后在至少有一个等式约束和不等式约束的违反超过容忍度时,计算回拉梯度矩阵增量并执行回拉操作,以保证整个迭代计算上升方向的过程在容忍满足所有约束的条件下进行。其中,当对某个不等式约束的违反超过容忍度时,意味着该不等式约束此时能够提供可行域的部分边界信息,故将被暂时当作等式约束处理用于上升方向的计算。本方法的创新之处在于提供一种求解图匹配问题的非线性规划方法,可广泛应用于解决计算机视觉领域的对象检测、特征跟踪、图片分类、形状匹配和图片检索等问题。
申请公布号 CN105740890A 申请公布日期 2016.07.06
申请号 CN201610056540.0 申请日期 2016.01.27
申请人 北京工业大学 发明人 李玉鑑;张亚红
分类号 G06K9/62(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 北京思海天达知识产权代理有限公司 11203 代理人 沈波
主权项 一种求解二次图匹配模型的方法,在给出具体的算法内容之前,这里先给出图匹配模型的问题描述;在图匹配模型中,定义一组图像匹配对pair(G,G′),其中G为第一幅图像特征点组成的图,G′为第二幅图像特征点所组成的图;其特征在于:G<sub>i</sub>(G′<sub>i′</sub>)表示图G(G′)中的第i个顶点,G<sub>ij</sub>∈{0,1}(G′<sub>i′j′</sub>∈{0,1})表示图中由G<sub>i</sub>(G′)及G<sub>j</sub>(G′<sub>j′</sub>)所组成的边,若G<sub>ij</sub>=1(G′<sub>i′j′</sub>=1)则边G<sub>ij</sub>(G′<sub>i′j′</sub>)存在,否则不存在;定义图像匹配矩阵x(x<sub>ii′</sub>∈{0,1}),如果x<sub>ii′</sub>=1表明图G中的顶点G<sub>i</sub>与图G′中顶点G′<sub>i′</sub>存在一致性对应关系,x<sub>ii′</sub>=0则相反;定义c为点配对矩阵,其中c<sub>ii′</sub>为点匹配对pair(G<sub>i</sub>,G′<sub>i′</sub>)的权重,同理,定义d为边配对矩阵,其中d<sub>ii′jj′</sub>为边配对pair(G<sub>ij</sub>,G′<sub>i′j′</sub>)的权重;那么图匹配问题就转化为求解最优图像匹配矩阵x<sup>*</sup>,以使二次规划目标函数达到最大化:<maths num="0001"><math><![CDATA[<mrow><msup><mi>x</mi><mo>*</mo></msup><mo>=</mo><munder><mi>argmax</mi><mi>x</mi></munder><mo>&lsqb;</mo><munder><mo>&Sigma;</mo><mrow><msup><mi>ii</mi><mo>&prime;</mo></msup></mrow></munder><msub><mi>c</mi><mrow><msup><mi>ii</mi><mo>&prime;</mo></msup></mrow></msub><msub><mi>x</mi><mrow><msup><mi>ii</mi><mo>&prime;</mo></msup></mrow></msub><mo>+</mo><munder><mo>&Sigma;</mo><mrow><msup><mi>ii</mi><mo>&prime;</mo></msup><msup><mi>jj</mi><mo>&prime;</mo></msup></mrow></munder><msub><mi>d</mi><mrow><msup><mi>ii</mi><mo>&prime;</mo></msup><msup><mi>jj</mi><mo>&prime;</mo></msup></mrow></msub><msub><mi>x</mi><mrow><msup><mi>ii</mi><mo>&prime;</mo></msup></mrow></msub><msub><mi>x</mi><mrow><msup><mi>jj</mi><mo>&prime;</mo></msup></mrow></msub><mo>&rsqb;</mo></mrow>]]></math><img file="FDA0000916203880000011.GIF" wi="771" he="165" /></maths><maths num="0002"><math><![CDATA[<mrow><mi>s</mi><mi>u</mi><mi>b</mi><mi>j</mi><mi>e</mi><mi>c</mi><mi>t</mi><mi> </mi><mi>t</mi><mi>o</mi><mo>:</mo><msub><mi>&Sigma;</mi><mi>i</mi></msub><msub><mi>x</mi><mrow><msup><mi>ii</mi><mo>&prime;</mo></msup></mrow></msub><mo>=</mo><mn>1</mn><mo>,</mo><mo>&ForAll;</mo><msup><mi>i</mi><mo>&prime;</mo></msup><mo>,</mo><msub><mi>&Sigma;</mi><msup><mi>i</mi><mo>&prime;</mo></msup></msub><msub><mi>x</mi><mrow><msup><mi>ii</mi><mo>&prime;</mo></msup></mrow></msub><mo>=</mo><mn>1</mn><mo>,</mo><mo>&ForAll;</mo><mi>i</mi></mrow>]]></math><img file="FDA0000916203880000012.GIF" wi="813" he="87" /></maths>其中1≤i,j,i′,j′≤m,m表示图G和G′中的顶点个数,即要求图像匹配矩阵的每一行元素之和为1、列元素之和为1;图像匹配矩阵x(x<sub>ii′</sub>∈{0,1})为0‑1矩阵,而为了计算方便,该矩阵首先定义为连续变量,并增加约束条件x<sub>ii′</sub>≥0,<img file="FDA0000916203880000013.GIF" wi="107" he="63" />只在最后一步做相应整数处理就得到真实的0‑1匹配矩阵;为便于后续描述,将上述的图匹配问题转化为标准的非线性规划模型:max f(vec(x))=vec(x)<sup>T</sup>vec(c)+vec(x)<sup>T</sup>dvec(x)<maths num="0003"><math><![CDATA[<mrow><mi>s</mi><mo>.</mo><mi>t</mi><mfenced open = "{" close = ""><mtable><mtr><mtd><mrow><msub><mi>g</mi><mn>1</mn></msub><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mo>:</mo><msub><mo>&Sigma;</mo><mn>1</mn></msub><msub><mi>x</mi><mrow><mn>1</mn><msup><mi>i</mi><mo>&prime;</mo></msup></mrow></msub><mo>-</mo><mn>1</mn><mo>=</mo><mn>0</mn></mrow></mtd></mtr><mtr><mtd><mn>...</mn></mtd></mtr><mtr><mtd><mrow><msub><mi>g</mi><mi>m</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mo>:</mo><msub><mo>&Sigma;</mo><mi>l</mi></msub><msub><mi>x</mi><mrow><msup><mi>li</mi><mo>&prime;</mo></msup></mrow></msub><mo>-</mo><mn>1</mn><mo>=</mo><mn>0</mn></mrow></mtd></mtr><mtr><mtd><mrow><msub><mi>g</mi><mrow><mi>m</mi><mo>+</mo><mn>1</mn></mrow></msub><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mo>:</mo><msub><mo>&Sigma;</mo><mn>1</mn></msub><msub><mi>x</mi><mrow><mi>i</mi><mn>1</mn></mrow></msub><mo>-</mo><mn>1</mn><mo>=</mo><mn>0</mn></mrow></mtd></mtr><mtr><mtd><mn>...</mn></mtd></mtr><mtr><mtd><mrow><msub><mi>g</mi><mrow><mn>2</mn><mi>m</mi></mrow></msub><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mo>:</mo><msub><mo>&Sigma;</mo><mi>m</mi></msub><msub><mi>x</mi><mrow><mi>i</mi><mi>m</mi></mrow></msub><mo>-</mo><mn>1</mn><mo>=</mo><mn>0</mn></mrow></mtd></mtr><mtr><mtd><mrow><msub><mi>h</mi><mn>1</mn></msub><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mo>:</mo><msub><mi>x</mi><mn>11</mn></msub><mo>&GreaterEqual;</mo><mn>0</mn></mrow></mtd></mtr><mtr><mtd><mn>...</mn></mtd></mtr><mtr><mtd><mrow><msub><mi>h</mi><msup><mi>m</mi><mn>2</mn></msup></msub><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mo>:</mo><msub><mi>x</mi><msup><mi>m</mi><mn>2</mn></msup></msub><mo>&GreaterEqual;</mo><mn>0</mn></mrow></mtd></mtr></mtable></mfenced></mrow>]]></math><img file="FDA0000916203880000014.GIF" wi="590" he="787" /></maths>其中vec(x)、vec(c)分别为图像匹配矩阵x和点配对矩阵c的列展开向量,vec(x)<sup>T</sup>为的vec(x)转置,g<sub>k</sub>(x)、h<sub>p</sub>(x)(1≤k≤2m,1≤p≤m<sup>2</sup>)分别表示匹配矩阵的每一行向量元素之和为1,每一列向量元素之和为1以及匹配矩阵的元素大于等于0的等式和不等式约束;m表示图G和G′中的顶点个数;2m为等式约束的个数;m<sup>2</sup>为不等式约束的个数。
地址 100124 北京市朝阳区平乐园100号