发明名称 基于图割能量优化的影像间最优拼接线寻找方法及系统
摘要 一种基于图割能量优化的影像间最优拼接线寻找方法及系统,进行待拼接影像数据准备,获得各待拼接影像之间所有重叠区域及相应重叠度;对待拼接影像进行预处理,综合考虑颜色、梯度以及纹理信息确定图割全局能量函数,图割全局能量函数包括数据项和平滑项,平滑项能量权重设置,采用图割能量优化方法,对总能量进行优化,获取最优拼接线。本发明所得拼接线尽量避免通过色差过大、纹理复杂区域以及明显地物的边缘,从而最大程度上保证了拼接线的最优化,解决了多影像多度重叠区域拼接线联合优化的问题,适用性广。
申请公布号 CN103985133B 申请公布日期 2017.01.18
申请号 CN201410242353.2 申请日期 2014.05.30
申请人 武汉大学 发明人 姚剑;李礼;唐文莉;常娟
分类号 G06T7/00(2006.01)I;G06T5/50(2006.01)I 主分类号 G06T7/00(2006.01)I
代理机构 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 代理人 严彦
主权项 一种基于图割能量优化的影像间最优拼接线寻找方法,包括以下步骤:步骤1,进行待拼接影像数据准备,获得各待拼接影像之间所有重叠区域及相应重叠度;步骤2,对待拼接影像进行预处理;步骤3,确定图割全局能量函数如下,设当前待拼接影像为N张,分别为影像I<sub>1</sub>,I<sub>2</sub>,I<sub>3</sub>,…,I<sub>N</sub>,构成的影像集为<img file="FDA0001017248110000011.GIF" wi="263" he="69" />图割全局能量函数包括E<sub>data</sub>和E<sub>smooth</sub>两项,<img file="FDA0001017248110000012.GIF" wi="662" he="63" />其中,E<sub>data</sub>和E<sub>smooth</sub>分别代表数据能量项和平滑能量项,其具体计算如下,所述数据能量项<img file="FDA0001017248110000013.GIF" wi="177" he="62" />的计算如下,<img file="FDA0001017248110000014.GIF" wi="597" he="127" />其中,E<sub>data</sub>(I<sub>k</sub>)代表经最优拼接线拼接后的影像J中每个像素来自于影像I<sub>k</sub>的能量惩罚,定义如下,E<sub>data</sub>(1<sub>k</sub>)=∑<sub>p∈J</sub>R<sub>p</sub>(I<sub>k</sub>)其中,p为拼接后影像J上的某个像素,R<sub>p</sub>(I<sub>k</sub>)代表像素p来自于影像I<sub>k</sub>的能量惩罚,定义如下,<maths num="0001"><math><![CDATA[<mrow><msub><mi>R</mi><mi>p</mi></msub><mrow><mo>(</mo><msub><mi>I</mi><mi>k</mi></msub><mo>)</mo></mrow><mo>=</mo><mfenced open = "{" close = ""><mtable><mtr><mtd><mn>0</mn></mtd><mtd><mrow><mi>p</mi><mo>&Element;</mo><msub><mi>I</mi><mi>k</mi></msub></mrow></mtd></mtr><mtr><mtd><mi>&infin;</mi></mtd><mtd><mrow><mi>p</mi><mo>&NotElement;</mo><msub><mi>I</mi><mi>k</mi></msub></mrow></mtd></mtr></mtable></mfenced></mrow>]]></math><img file="FDA0001017248110000015.GIF" wi="453" he="118" /></maths>所述平滑能量项<img file="FDA0001017248110000016.GIF" wi="227" he="54" />定义如下,<img file="FDA0001017248110000017.GIF" wi="798" he="70" />其中,颜色空间能量项<img file="FDA0001017248110000018.GIF" wi="190" he="55" />以及梯度空间能量项<img file="FDA0001017248110000019.GIF" wi="251" he="63" />的计算公式如下,<img file="FDA00010172481100000110.GIF" wi="1365" he="295" />其中,p和q为两个相邻的像素,<img file="FDA00010172481100000111.GIF" wi="236" he="55" /><img file="FDA00010172481100000112.GIF" wi="128" he="55" />为像素p的四邻域,<img file="FDA00010172481100000113.GIF" wi="110" he="63" />和<img file="FDA00010172481100000114.GIF" wi="104" he="63" />分别代表拼接后影像J中像素p和q所属影像的编号,函数<img file="FDA00010172481100000115.GIF" wi="299" he="71" />的定义如下,<img file="FDA00010172481100000116.GIF" wi="793" he="114" /><img file="FDA00010172481100000117.GIF" wi="292" he="62" />和<img file="FDA00010172481100000118.GIF" wi="352" he="71" />分别代表相邻像素p和q在重叠区域对应的颜色空间平滑项能量和梯度空间平滑项能量,定义如下,<img file="FDA0001017248110000021.GIF" wi="1086" he="175" />其中,I<sub>a</sub>和I<sub>b</sub>为影像集<img file="FDA0001017248110000022.GIF" wi="240" he="63" />中任意两个存在重叠区域的影像,设影像I<sub>a</sub>,I<sub>b</sub>构成待拼接影像对<img file="FDA0001017248110000023.GIF" wi="625" he="64" />和<img file="FDA0001017248110000024.GIF" wi="377" he="63" />分别为相邻像素p和q在I<sub>a</sub>和I<sub>b</sub>重叠区域对应的颜色空间平滑项能量和梯度空间平滑项能量;步骤4,平滑项能量权重设置,包括基于步骤3所得结果,将单个像素的颜色空间能量项<img file="FDA0001017248110000025.GIF" wi="190" he="54" />以及梯度空间能量项<img file="FDA0001017248110000026.GIF" wi="252" he="62" />重新定义如下,<img file="FDA0001017248110000027.GIF" wi="965" he="134" />其中,w<sub>d</sub>(p)为像素p靠近重叠区域边缘的权重,定义如下:,<maths num="0002"><math><![CDATA[<mrow><msub><mi>w</mi><mi>d</mi></msub><mrow><mo>(</mo><mi>p</mi><mo>)</mo></mrow><mo>=</mo><mfenced open = "{" close = ""><mtable><mtr><mtd><mn>1</mn></mtd><mtd><mrow><mi>i</mi><mi>f</mi><mi> </mi><mi>d</mi><mrow><mo>(</mo><mi>p</mi><mo>)</mo></mrow><mo>&gt;</mo><msub><mi>d</mi><mrow><mi>t</mi><mi>h</mi></mrow></msub></mrow></mtd></mtr><mtr><mtd><mfrac><msub><mi>d</mi><mrow><mi>t</mi><mi>h</mi></mrow></msub><mrow><mi>d</mi><mrow><mo>(</mo><mi>p</mi><mo>)</mo></mrow></mrow></mfrac></mtd><mtd><mrow><mi>o</mi><mi>t</mi><mi>h</mi><mi>e</mi><mi>r</mi><mi>w</mi><mi>i</mi><mi>s</mi><mi>e</mi></mrow></mtd></mtr></mtable></mfenced></mrow>]]></math><img file="FDA0001017248110000028.GIF" wi="654" he="191" /></maths>其中,d(p)表示像素p到重叠区域边缘的最短距离,d<sub>th</sub>为预设阈值;步骤5,采用图割能量优化方法,对经步骤4重新定义颜色空间能量项<img file="FDA0001017248110000029.GIF" wi="191" he="55" />以及梯度空间能量项<img file="FDA00010172481100000210.GIF" wi="253" he="63" />后的总能量<img file="FDA00010172481100000211.GIF" wi="100" he="55" />进行优化,获取最优拼接线。
地址 430072 湖北省武汉市武昌区珞珈山武汉大学