发明名称 基于局部反馈机制与稀疏全局调整的航拍图像拼接方法
摘要 本发明公开了一种基于局部反馈机制与稀疏全局调整的航拍图像拼接方法,主要解决对特征点不明显的高原地区无人机航拍视频图像采用常规方法拼接易出现误配、失配的问题。其首先对图像进行SIFT特征提取和匹配,若通过特征匹配能建立图像变换模型且配准效果较好,则继续拼接下一帧图像;若提取SIFT特征后,特征匹配对不足以建立图像变换模型,或足以建立图像变换模型但图像拼缝处有明显错位,则建立一种局部反馈机制,对前两次的拼接进行反馈调节;若反馈调节失败,则利用无人机惯导数据信息进行图像配准,继续拼接至最终拼接出一幅全景图;最后利用拼接图像特征点间的对应关系建立优化目标函数,对全景图进行稀疏全局调整,改善全景图效果。
申请公布号 CN104574278B 申请公布日期 2016.03.23
申请号 CN201510054757.3 申请日期 2015.02.03
申请人 中国人民解放军国防科学技术大学 发明人 王炜;袁晶;张茂军;刘煜;张政
分类号 G06T3/40(2006.01)I 主分类号 G06T3/40(2006.01)I
代理机构 北京中济纬天专利代理有限公司 11429 代理人 胡伟华
主权项 基于局部反馈机制与稀疏全局调整的航拍图像拼接方法,其特征在于:首先,根据尺度不变特征转换特征提取算法,提取无人机侦察视频图像的尺度不变特征转换特征点并利用特征点进行特征匹配从而得到图像之间的几何变换关系;在对无人机侦察视频图像进行尺度不变特征转换特征提取和匹配过程中,一旦出现无人机侦察视频图像的尺度不变特征转换特征点少,特征匹配对不足以建立几何变换模型,或足以建立几何变换模型但图像拼缝处有明显错位,就利用无人机惯导系统获取的辅助信息数据对前两次的拼接进行反馈调节,建立了一种局部反馈机制,包括如下步骤:1)根据无人机惯导系统所记录的惯导数据中获得图像的坐标信息,将图像投影到WGS84坐标系下,确定图像在拼接图中的粗略位置和图像间的变换参数;2)根据图像I<sub>n</sub>在拼接图中的粗略位置控制偏差在20个像素以内,对目标图像I<sub>n‑1</sub>和I<sub>n‑2</sub>进行旋转和平移;假设第n次拼接时需进行反馈调节,根据建立的局部反馈机制,将对第n‑1次拼接和第n‑2次拼接进行调节;选取第一帧图像作为参考图像,用I<sub>0</sub>表示,从第二帧开始的无人机视频图像序列作为目标图像,表示为I<sub>i</sub>(i=1,2,3…);每次拼接后得到的拼接图像表示为M<sub>i</sub>(i=1,2,3…);其次,建立了一个优化目标函数,通过求解优化目标函数对拼接全景图进行稀疏全局调整,包括如下步骤:1)对于无法通过特征匹配得到单应矩阵的这些图像,利用通过坐标信息得到的变换参数对这些图像提取出来的少数稀疏的特征点进行坐标变换,确定它们在全景图中的位置;2)对于其他特征信息丰富,能通过特征匹配建立图像变换模型的图像中的特征点,通过这些特征点之间的对应关系和它们与通过坐标信息进行坐标变换的特征点之间的对应关系,建立优化目标函数f(X);优化目标函数f(X)定义为<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>f</mi><mrow><mo>(</mo><mi>X</mi><mo>)</mo></mrow><mo>=</mo><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msubsup><mi>e</mi><mi>i</mi><mi>T</mi></msubsup><msub><mi>e</mi><mi>i</mi></msub><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000855700340000011.GIF" wi="1126" he="143" /></maths>其中:<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><msub><mi>e</mi><mi>i</mi></msub><mo>=</mo><mfenced open = "{" close = ""><mtable><mtr><mtd><mrow><msubsup><mi>P</mi><mrow><mi>i</mi><mo>,</mo><mi>m</mi></mrow><mi>f</mi></msubsup><mo>-</mo><msub><mi>T</mi><mi>n</mi></msub><mrow><mo>(</mo><msub><mi>P</mi><mrow><mi>i</mi><mo>,</mo><mi>n</mi></mrow></msub><mo>)</mo></mrow></mrow></mtd><mtd><mrow><mi>i</mi><mo>=</mo><mn>1</mn><mo>,</mo><mo>...</mo><mo>,</mo><msub><mi>N</mi><mi>f</mi></msub></mrow></mtd></mtr><mtr><mtd><mrow><msub><mi>T</mi><mi>r</mi></msub><mrow><mo>(</mo><msub><mi>P</mi><mrow><mi>i</mi><mo>,</mo><mi>r</mi></mrow></msub><mo>)</mo></mrow><mo>-</mo><msub><mi>T</mi><mi>s</mi></msub><mrow><mo>(</mo><msub><mi>P</mi><mrow><mi>i</mi><mo>,</mo><mi>s</mi></mrow></msub><mo>)</mo></mrow></mrow></mtd><mtd><mrow><mi>i</mi><mo>=</mo><msub><mi>N</mi><mi>f</mi></msub><mo>+</mo><mn>1</mn><mo>,</mo><mo>...</mo><mo>,</mo><mi>N</mi></mrow></mtd></mtr></mtable></mfenced><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000855700340000021.GIF" wi="1421" he="183" /></maths>N<sub>f</sub>表示利用坐标信息的图像与利用特征信息的图像之间的特征对应个数;<img file="FDA0000855700340000022.GIF" wi="76" he="86" />表示利用坐标信息得到的图像变换参数对图像中的特征点坐标变换后的坐标,在式(2)中为常量;T<sub>n</sub>(P<sub>i,n</sub>)表示用通过特征匹配的M<sub>u</sub>帧图像中的第n帧图像的变换参数X<sub>n</sub>对该图像中的一个特征点P<sub>i,n</sub>进行坐标变换的坐标;<img file="FDA0000855700340000023.GIF" wi="204" he="95" />是利用坐标信息的图像与利用特征信息的图像之间的一对匹配的特征点;(P<sub>i,r</sub>,P<sub>i,s</sub>)是利用坐标信息的图像之间的一对匹配的特征点;<img file="FDA0000855700340000024.GIF" wi="516" he="103" />其中X<sub>i</sub>表示M<sub>u</sub>帧图像中第i帧的图像变换参数,由其对应的单应矩阵H中的8个参数组成的列向量构成;3)以全部图像通过坐标信息得到的变换参数作为初值,用最小二乘法(LM)进行求解;令A=J<sup>T</sup>J+λE,A表示一个稀疏矩阵,λ表示任意两幅无法通过特征匹配得到单应矩阵的图像,它们的中心点之间的距离与图像的长边的比,λ的值取1.5,E表示单位矩阵,J表示雅克比矩阵;4)LM算法通过线性方程AΔX=‑J<sup>T</sup>e迭代求解X,其中:<img file="FDA0000855700340000025.GIF" wi="630" he="127" />5)利用矩阵A的稀疏特性,使用直接稀疏平方根法求解式AΔX=‑J<sup>T</sup>e;6)根据解X,能够得到稀疏全局调整后每幅图像的变换矩阵H',将图像通过H'都变换到同一平面即得到优化后的拼接全景图。
地址 410073 湖南省长沙市开福区德雅路109号