发明名称 一种旋转和尺度不变的宽基线立体匹配方法
摘要 本发明涉及一种旋转和尺度不变的宽基线立体匹配方法,包括:S1、对基准图像和参考图像进行初始的旋转和尺度不变的稀疏特征匹配;S2、对基准图像中的当前像素点,先计算局部几何变换矩阵和初始匹配点,然后选取方形匹配窗口,根据几何变换矩阵得到归一化后的匹配窗口;S3、在参考图像中搜索当前像素点的最佳匹配点,并记录匹配的可信度;S4、重复步骤S2至S3,直至遍历图像的所有像素点,并按照可信度将得到的匹配点分类;S5、输出稠密视差图,显示立体匹配结果。与现有技术相比,本发明能较好地处理存在旋转和尺度变化的宽基线立体图像匹配,得到准确、稠密的视差图,具有鲁棒可靠、匹配精度高、设计简单等特点以及较高的实用价值。
申请公布号 CN103700099A 申请公布日期 2014.04.02
申请号 CN201310697413.5 申请日期 2013.12.18
申请人 同济大学 发明人 石繁槐;高健
分类号 G06T7/00(2006.01)I 主分类号 G06T7/00(2006.01)I
代理机构 上海科盛知识产权代理有限公司 31225 代理人 王小荣
主权项 1.一种旋转和尺度不变的宽基线立体匹配方法,其特征在于,包括以下步骤:S1、读取待匹配的宽基线立体图像对:基准图像I<sub>l</sub>和参考图像I<sub>r</sub>,对这两幅图像进行初始的旋转和尺度不变的稀疏特征匹配;S2、对基准图像I<sub>l</sub>中的当前像素点p<sub>l</sub>,先利用初始稀疏匹配结果计算局部几何变换矩阵H,再计算当前像素点p<sub>l</sub>在参考图像I<sub>r</sub>中的初始匹配点p<sub>r0</sub>,即p<sub>r0</sub>=H*p<sub>l</sub>,然后选取方形匹配窗口N<sub>l</sub>,根据几何变换矩阵H归一化该窗口,使归一化后的匹配窗口N<sub>r</sub>能根据两幅图像之间的几何变换自适应地调整大小、方向及形状,捕捉相同场景的图像内容,其中p<sub>l</sub>,p<sub>r0</sub>是齐次坐标,即p<sub>l</sub>=(x<sub>l</sub>,y<sub>l</sub>,1)<sup>T</sup>,p<sub>r0</sub>=(x<sub>r0</sub>,y<sub>r0</sub>,1)<sup>T</sup>;S3、对基准图像I<sub>l</sub>中的像素点p<sub>l</sub>,在参考图像I<sub>r</sub>中以p<sub>l</sub>+d<sub>0</sub>为中心选取邻域<img file="FDA0000440261310000019.GIF" wi="109" he="80" />内的若干个候选匹配点p<sub>r</sub>,采用加权的零均值归一化互相关算法计算窗口图像的匹配代价C<sub>WMZNCC</sub>(p<sub>l</sub>,p<sub>r</sub>),搜索匹配代价最小的候选匹配点p<sub>r</sub>作为像素点p<sub>l</sub>的最佳匹配点,并记录匹配的可信度S,<![CDATA[<math><mrow><mi>S</mi><mo>=</mo><mn>1</mn><mo>-</mo><munder><mi>min</mi><mrow><msub><mi>p</mi><mi>r</mi></msub><mo>&Element;</mo><msub><mi>N</mi><msub><mi>p</mi><mrow><mi>r</mi><mn>0</mn></mrow></msub></msub></mrow></munder><mrow><mo>(</mo><msub><mi>C</mi><mi>WMZNCC</mi></msub><mrow><mo>(</mo><msub><mi>p</mi><mi>l</mi></msub><mo>,</mo><msub><mi>p</mi><mi>r</mi></msub><mo>)</mo></mrow><mo>)</mo></mrow></mrow></math>]]></maths>其中,d<sub>0</sub>为当前像素点p<sub>l</sub>与其初始匹配点p<sub>r0</sub>的初始视差,即d<sub>0</sub>=(x<sub>r0</sub>-xl,yr0-yl)T,<![CDATA[<math><mrow><msub><mi>C</mi><mi>WMZNCC</mi></msub><mrow><mo>(</mo><msub><mi>p</mi><mi>l</mi></msub><mo>,</mo><msub><mi>p</mi><mi>r</mi></msub><mo>)</mo></mrow></mrow></math>]]></maths><![CDATA[<math><mrow><mo>=</mo><mn>1</mn><mo>-</mo><mfrac><mrow><mn>2</mn><msub><mi>&Sigma;</mi><mrow><msub><mi>q</mi><mi>l</mi></msub><mo>&Element;</mo><msub><mi>N</mi><mi>l</mi></msub><mo>,</mo><msub><mi>q</mi><mi>r</mi></msub><mo>&Element;</mo><msub><mi>N</mi><mi>r</mi></msub></mrow></msub><msub><mi>w</mi><mi>l</mi></msub><mrow><mo>(</mo><msub><mi>p</mi><mi>l</mi></msub><mo>,</mo><msub><mi>q</mi><mi>l</mi></msub><mo>)</mo></mrow><msub><mi>w</mi><mi>r</mi></msub><mrow><mo>(</mo><msub><mi>p</mi><mi>r</mi></msub><mo>,</mo><msub><mi>q</mi><mi>r</mi></msub><mo>)</mo></mrow><mrow><mo>(</mo><msub><mi>I</mi><mi>l</mi></msub><mrow><mo>(</mo><msub><mi>q</mi><mi>l</mi></msub><mo>)</mo></mrow><mo>-</mo><mover><msub><mi>I</mi><mi>l</mi></msub><mo>&OverBar;</mo></mover><mrow><mo>(</mo><msub><mi>q</mi><mi>l</mi></msub><mo>)</mo></mrow><mo>)</mo></mrow><mrow><mo>(</mo><msub><mi>I</mi><mi>r</mi></msub><mrow><mo>(</mo><msub><mi>q</mi><mi>r</mi></msub><mo>)</mo></mrow><mo>-</mo><mover><msub><mi>I</mi><mi>r</mi></msub><mo>&OverBar;</mo></mover><mrow><mo>(</mo><msub><mi>q</mi><mi>r</mi></msub><mo>)</mo></mrow><mo>)</mo></mrow></mrow><mrow><msub><mi>&Sigma;</mi><mrow><msub><mi>q</mi><mi>l</mi></msub><mo>&Element;</mo><msub><mi>N</mi><mi>l</mi></msub></mrow></msub><msub><mi>w</mi><mi>l</mi></msub><mrow><mo>(</mo><msub><mi>p</mi><mi>l</mi></msub><mo>,</mo><msub><mi>q</mi><mi>l</mi></msub><mo>)</mo></mrow><mrow><mo>(</mo><msub><mi>I</mi><mi>l</mi></msub><mrow><mo>(</mo><msub><mi>q</mi><mi>l</mi></msub><mo>)</mo></mrow><mo>-</mo><mover><msub><mi>I</mi><mi>l</mi></msub><mo>&OverBar;</mo></mover><mrow><mo>(</mo><msub><mi>q</mi><mi>l</mi></msub><mo>)</mo></mrow><mo>)</mo></mrow><mo>+</mo><msub><mi>&Sigma;</mi><mrow><msub><mi>q</mi><mi>r</mi></msub><mo>&Element;</mo><msub><mi>N</mi><mi>r</mi></msub></mrow></msub><msub><mi>w</mi><mi>r</mi></msub><mrow><mo>(</mo><msub><mi>p</mi><mi>r</mi></msub><mo>,</mo><msub><mi>q</mi><mi>r</mi></msub><mo>)</mo></mrow><mrow><mo>(</mo><msub><mi>I</mi><mi>r</mi></msub><mrow><mo>(</mo><msub><mi>q</mi><mi>r</mi></msub><mo>)</mo></mrow><mo>-</mo><mover><msub><mi>I</mi><mi>r</mi></msub><mo>&OverBar;</mo></mover><mrow><mo>(</mo><msub><mi>q</mi><mi>r</mi></msub><mo>)</mo></mrow><mo>)</mo></mrow></mrow></mfrac></mrow></math>]]></maths>式中,I<sub>l</sub>(q<sub>l</sub>)表示图像I<sub>l</sub>中位置为q<sub>l</sub>的像素点的灰度值,I<sub>r</sub>(q<sub>r</sub>)表示图像I<sub>r</sub>中位置为q<sub>r</sub>的像素点的灰度值,<img file="FDA0000440261310000014.GIF" wi="123" he="66" />是窗口N<sub>l</sub>中所有像素点灰度值的均值,<img file="FDA0000440261310000015.GIF" wi="133" he="65" />是窗口N<sub>r</sub>中所有像素点灰度值的均值,权值w<sub>l</sub>(p<sub>l</sub>,q<sub>l</sub>)、w<sub>r</sub>(p<sub>r</sub>,q<sub>r</sub>)由下式给出:<![CDATA[<math><mrow><mi>w</mi><mrow><mo>(</mo><mi>p</mi><mo>,</mo><mi>q</mi><mo>)</mo></mrow><mo>=</mo><mi>exp</mi><mrow><mo>(</mo><mo>-</mo><mrow><mo>(</mo><mfrac><msub><mi>&Delta;</mi><msub><mi>c</mi><mi>pq</mi></msub></msub><msub><mi>&gamma;</mi><mi>c</mi></msub></mfrac><mo>+</mo><mfrac><msub><mi>&Delta;</mi><msub><mi>g</mi><mi>pq</mi></msub></msub><msub><mi>&gamma;</mi><mi>p</mi></msub></mfrac><mo>)</mo></mrow><mo>)</mo></mrow></mrow></math>]]></maths>其中,<img file="FDA0000440261310000017.GIF" wi="94" he="72" />表示q点和p点在Lab颜色空间的颜色相似度,即欧几里德距离,<img file="FDA0000440261310000018.GIF" wi="95" he="71" />表示q点和p点在空间位置上的欧几里德距离,γ<sub>c</sub>、γ<sub>p</sub>是根据经验设定的比例常数,分别用来调节颜色相似度和几何接近性对权值大小的影响;S4、重复步骤S2至S3,直至遍历图像I<sub>l</sub>的所有像素点,并按照可信度S将得到的匹配点分为可靠匹配点、不可靠匹配点和遮挡点,即<img file="FDA0000440261310000021.GIF" wi="732" he="264" />其中S<sub>1</sub>为遮挡点阈值,S<sub>2</sub>为可靠匹配点阈值;S5、先以不可靠匹配点周围区域内的可靠匹配点作为参考,校正当前像素点的视差,再由遮挡点周围可靠匹配点的视差插值得到该遮挡点的视差,最后输出稠密视差图,显示立体匹配结果。
地址 200092 上海市杨浦区四平路1239号