一种旋转和尺度不变的宽基线立体匹配方法,申请号CN201310697413.5-传众专利搜索

发明名称	一种旋转和尺度不变的宽基线立体匹配方法
摘要	本发明涉及一种旋转和尺度不变的宽基线立体匹配方法，包括：S1、对基准图像和参考图像进行初始的旋转和尺度不变的稀疏特征匹配；S2、对基准图像中的当前像素点，先计算局部几何变换矩阵和初始匹配点，然后选取方形匹配窗口，根据几何变换矩阵得到归一化后的匹配窗口；S3、在参考图像中搜索当前像素点的最佳匹配点，并记录匹配的可信度；S4、重复步骤S2至S3，直至遍历图像的所有像素点，并按照可信度将得到的匹配点分类；S5、输出稠密视差图，显示立体匹配结果。与现有技术相比，本发明能较好地处理存在旋转和尺度变化的宽基线立体图像匹配，得到准确、稠密的视差图，具有鲁棒可靠、匹配精度高、设计简单等特点以及较高的实用价值。
申请公布号	CN103700099A	申请公布日期	2014.04.02
申请号	CN201310697413.5	申请日期	2013.12.18
申请人	同济大学	发明人	石繁槐;高健
分类号	G06T7/00(2006.01)I	主分类号	G06T7/00(2006.01)I
代理机构	上海科盛知识产权代理有限公司 31225	代理人	王小荣
主权项	1.一种旋转和尺度不变的宽基线立体匹配方法，其特征在于，包括以下步骤：S1、读取待匹配的宽基线立体图像对：基准图像I<sub>l</sub>和参考图像I<sub>r</sub>，对这两幅图像进行初始的旋转和尺度不变的稀疏特征匹配；S2、对基准图像I<sub>l</sub>中的当前像素点p<sub>l</sub>，先利用初始稀疏匹配结果计算局部几何变换矩阵H，再计算当前像素点p<sub>l</sub>在参考图像I<sub>r</sub>中的初始匹配点p<sub>r0</sub>，即p<sub>r0</sub>＝H*p<sub>l</sub>，然后选取方形匹配窗口N<sub>l</sub>，根据几何变换矩阵H归一化该窗口，使归一化后的匹配窗口N<sub>r</sub>能根据两幅图像之间的几何变换自适应地调整大小、方向及形状，捕捉相同场景的图像内容，其中p<sub>l</sub>，p<sub>r0</sub>是齐次坐标，即p<sub>l</sub>＝(x<sub>l</sub>，y<sub>l</sub>，1)<sup>T</sup>，p<sub>r0</sub>＝(x<sub>r0</sub>，y<sub>r0</sub>，1)<sup>T</sup>；S3、对基准图像I<sub>l</sub>中的像素点p<sub>l</sub>，在参考图像I<sub>r</sub>中以p<sub>l</sub>+d<sub>0</sub>为中心选取邻域<img file="FDA0000440261310000019.GIF" wi="109" he="80" />内的若干个候选匹配点p<sub>r</sub>，采用加权的零均值归一化互相关算法计算窗口图像的匹配代价C<sub>WMZNCC</sub>(p<sub>l</sub>，p<sub>r</sub>)，搜索匹配代价最小的候选匹配点p<sub>r</sub>作为像素点p<sub>l</sub>的最佳匹配点，并记录匹配的可信度S，<![CDATA[<math><mrow><mi>S</mi><mo>=</mo><mn>1</mn><mo>-</mo><munder><mi>min</mi><mrow><msub><mi>p</mi><mi>r</mi></msub><mo>&Element;</mo><msub><mi>N</mi><msub><mi>p</mi><mrow><mi>r</mi><mn>0</mn></mrow></msub></msub></mrow></munder><mrow><mo>(</mo><msub><mi>C</mi><mi>WMZNCC</mi></msub><mrow><mo>(</mo><msub><mi>p</mi><mi>l</mi></msub><mo>,</mo><msub><mi>p</mi><mi>r</mi></msub><mo>)</mo></mrow><mo>)</mo></mrow></mrow></math>]]></maths>其中，d<sub>0</sub>为当前像素点p<sub>l</sub>与其初始匹配点p<sub>r0</sub>的初始视差，即d<sub>0</sub>＝(x<sub>r0</sub>-xl，yr0-yl)T，<![CDATA[<math><mrow><msub><mi>C</mi><mi>WMZNCC</mi></msub><mrow><mo>(</mo><msub><mi>p</mi><mi>l</mi></msub><mo>,</mo><msub><mi>p</mi><mi>r</mi></msub><mo>)</mo></mrow></mrow></math>]]></maths><![CDATA[<math><mrow><mo>=</mo><mn>1</mn><mo>-</mo><mfrac><mrow><mn>2</mn><msub><mi>Σ</mi><mrow><msub><mi>q</mi><mi>l</mi></msub><mo>&Element;</mo><msub><mi>N</mi><mi>l</mi></msub><mo>,</mo><msub><mi>q</mi><mi>r</mi></msub><mo>&Element;</mo><msub><mi>N</mi><mi>r</mi></msub></mrow></msub><msub><mi>w</mi><mi>l</mi></msub><mrow><mo>(</mo><msub><mi>p</mi><mi>l</mi></msub><mo>,</mo><msub><mi>q</mi><mi>l</mi></msub><mo>)</mo></mrow><msub><mi>w</mi><mi>r</mi></msub><mrow><mo>(</mo><msub><mi>p</mi><mi>r</mi></msub><mo>,</mo><msub><mi>q</mi><mi>r</mi></msub><mo>)</mo></mrow><mrow><mo>(</mo><msub><mi>I</mi><mi>l</mi></msub><mrow><mo>(</mo><msub><mi>q</mi><mi>l</mi></msub><mo>)</mo></mrow><mo>-</mo><mover><msub><mi>I</mi><mi>l</mi></msub><mo>&OverBar;</mo></mover><mrow><mo>(</mo><msub><mi>q</mi><mi>l</mi></msub><mo>)</mo></mrow><mo>)</mo></mrow><mrow><mo>(</mo><msub><mi>I</mi><mi>r</mi></msub><mrow><mo>(</mo><msub><mi>q</mi><mi>r</mi></msub><mo>)</mo></mrow><mo>-</mo><mover><msub><mi>I</mi><mi>r</mi></msub><mo>&OverBar;</mo></mover><mrow><mo>(</mo><msub><mi>q</mi><mi>r</mi></msub><mo>)</mo></mrow><mo>)</mo></mrow></mrow><mrow><msub><mi>Σ</mi><mrow><msub><mi>q</mi><mi>l</mi></msub><mo>&Element;</mo><msub><mi>N</mi><mi>l</mi></msub></mrow></msub><msub><mi>w</mi><mi>l</mi></msub><mrow><mo>(</mo><msub><mi>p</mi><mi>l</mi></msub><mo>,</mo><msub><mi>q</mi><mi>l</mi></msub><mo>)</mo></mrow><mrow><mo>(</mo><msub><mi>I</mi><mi>l</mi></msub><mrow><mo>(</mo><msub><mi>q</mi><mi>l</mi></msub><mo>)</mo></mrow><mo>-</mo><mover><msub><mi>I</mi><mi>l</mi></msub><mo>&OverBar;</mo></mover><mrow><mo>(</mo><msub><mi>q</mi><mi>l</mi></msub><mo>)</mo></mrow><mo>)</mo></mrow><mo>+</mo><msub><mi>Σ</mi><mrow><msub><mi>q</mi><mi>r</mi></msub><mo>&Element;</mo><msub><mi>N</mi><mi>r</mi></msub></mrow></msub><msub><mi>w</mi><mi>r</mi></msub><mrow><mo>(</mo><msub><mi>p</mi><mi>r</mi></msub><mo>,</mo><msub><mi>q</mi><mi>r</mi></msub><mo>)</mo></mrow><mrow><mo>(</mo><msub><mi>I</mi><mi>r</mi></msub><mrow><mo>(</mo><msub><mi>q</mi><mi>r</mi></msub><mo>)</mo></mrow><mo>-</mo><mover><msub><mi>I</mi><mi>r</mi></msub><mo>&OverBar;</mo></mover><mrow><mo>(</mo><msub><mi>q</mi><mi>r</mi></msub><mo>)</mo></mrow><mo>)</mo></mrow></mrow></mfrac></mrow></math>]]></maths>式中，I<sub>l</sub>(q<sub>l</sub>)表示图像I<sub>l</sub>中位置为q<sub>l</sub>的像素点的灰度值，I<sub>r</sub>(q<sub>r</sub>)表示图像I<sub>r</sub>中位置为q<sub>r</sub>的像素点的灰度值，<img file="FDA0000440261310000014.GIF" wi="123" he="66" />是窗口N<sub>l</sub>中所有像素点灰度值的均值，<img file="FDA0000440261310000015.GIF" wi="133" he="65" />是窗口N<sub>r</sub>中所有像素点灰度值的均值，权值w<sub>l</sub>(p<sub>l</sub>，q<sub>l</sub>)、w<sub>r</sub>(p<sub>r</sub>，q<sub>r</sub>)由下式给出：<![CDATA[<math><mrow><mi>w</mi><mrow><mo>(</mo><mi>p</mi><mo>,</mo><mi>q</mi><mo>)</mo></mrow><mo>=</mo><mi>exp</mi><mrow><mo>(</mo><mo>-</mo><mrow><mo>(</mo><mfrac><msub><mi>Δ</mi><msub><mi>c</mi><mi>pq</mi></msub></msub><msub><mi>γ</mi><mi>c</mi></msub></mfrac><mo>+</mo><mfrac><msub><mi>Δ</mi><msub><mi>g</mi><mi>pq</mi></msub></msub><msub><mi>γ</mi><mi>p</mi></msub></mfrac><mo>)</mo></mrow><mo>)</mo></mrow></mrow></math>]]></maths>其中，<img file="FDA0000440261310000017.GIF" wi="94" he="72" />表示q点和p点在Lab颜色空间的颜色相似度，即欧几里德距离，<img file="FDA0000440261310000018.GIF" wi="95" he="71" />表示q点和p点在空间位置上的欧几里德距离，γ<sub>c</sub>、γ<sub>p</sub>是根据经验设定的比例常数，分别用来调节颜色相似度和几何接近性对权值大小的影响；S4、重复步骤S2至S3，直至遍历图像I<sub>l</sub>的所有像素点，并按照可信度S将得到的匹配点分为可靠匹配点、不可靠匹配点和遮挡点，即<img file="FDA0000440261310000021.GIF" wi="732" he="264" />其中S<sub>1</sub>为遮挡点阈值，S<sub>2</sub>为可靠匹配点阈值；S5、先以不可靠匹配点周围区域内的可靠匹配点作为参考，校正当前像素点的视差，再由遮挡点周围可靠匹配点的视差插值得到该遮挡点的视差，最后输出稠密视差图，显示立体匹配结果。
地址	200092 上海市杨浦区四平路1239号