发明名称 一种基于贝叶斯理论的视频拼接方法
摘要 本发明提出了一种基于贝叶斯理论的视频拼接方法。该方法通过对视频对应帧估计流场,同时考虑流场不精确引起的图像配准误差;通过在时间上和空间上应用贝叶斯原理,将图像误差作为自适应可靠性,得到视频拼接的后验概率模型;通过优化方法求解最大后验模型,得到稳定的高质量视频输出结果。本文提出的方法能够在空间上有效的去除由于流场估计不准确产生的奇异点,时间上保证视频稳定性,从而得到高质量的视频输出结果。
申请公布号 CN105635808A 申请公布日期 2016.06.01
申请号 CN201511028511.5 申请日期 2015.12.31
申请人 电子科技大学 发明人 杨路;苏建美;王泽;程洪
分类号 H04N21/44(2011.01)I;H04N5/232(2006.01)I 主分类号 H04N21/44(2011.01)I
代理机构 成都金英专利代理事务所(普通合伙) 51218 代理人 袁英
主权项 一种基于贝叶斯理论的视频拼接方法,其特征在于:它包括以下步骤:S1:获取视频流对应帧重叠区域,并分别以两幅图像作为基准图,估计前向后向流场:令I<sub>tL</sub>和I<sub>tR</sub>分别是两幅当前待拼接视频对应帧图像的重叠区域,通过分别对带拼接视频帧作用前向流场和后向流场,获得四个虚拟视角:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>I</mi><mrow><mi>t</mi><mn>1</mn></mrow></msub><mo>=</mo><msub><mi>H</mi><mrow><msub><mi>tf</mi><mn>1</mn></msub></mrow></msub><msub><mi>I</mi><mrow><mi>t</mi><mi>L</mi></mrow></msub><mo>,</mo><msub><mi>I</mi><mrow><mi>t</mi><mn>2</mn></mrow></msub><mo>=</mo><mrow><mo>(</mo><mo>-</mo><msub><mi>H</mi><mrow><msub><mi>tf</mi><mn>2</mn></msub></mrow></msub><mo>)</mo></mrow><msub><mi>I</mi><mrow><mi>t</mi><mi>L</mi></mrow></msub><mo>,</mo><msub><mi>I</mi><mrow><mi>t</mi><mn>3</mn></mrow></msub><mo>=</mo><msub><mi>H</mi><mrow><msub><mi>tf</mi><mn>3</mn></msub></mrow></msub><msub><mi>I</mi><mrow><mi>t</mi><mi>R</mi></mrow></msub><mo>,</mo><msub><mi>I</mi><mrow><mi>t</mi><mn>4</mn></mrow></msub><mo>=</mo><mrow><mo>(</mo><mo>-</mo><msub><mi>H</mi><mrow><msub><mi>tf</mi><mn>4</mn></msub></mrow></msub><mo>)</mo></mrow><msub><mi>I</mi><mrow><mi>t</mi><mi>R</mi></mrow></msub><mo>;</mo></mrow>]]></math><img file="FDA0000898569180000012.GIF" wi="1180" he="71" /></maths>其中,<img file="FDA0000898569180000013.GIF" wi="79" he="69" />与<img file="FDA0000898569180000014.GIF" wi="84" he="69" />分别为作用在左图的前向流场与后向流场,<img file="FDA0000898569180000015.GIF" wi="79" he="74" />与<img file="FDA0000898569180000016.GIF" wi="84" he="74" />分别为作用在右图上的前向流场与后向流场;S2:构建基于贝叶斯原理的视频融合能量函数结构:分别对视频在空间和时间上进行贝叶斯推理,提出基于贝叶斯模型的视频拼接框架,通过优化后验概率能量函数获得拼接结果;其中,在空间上保证视频拼接奇异点的有效消除,质量较高,在时间上去除视频闪烁,保证视频稳定输出,同时采用先验概率支持最近邻平滑,包括以下子步骤:S21:获得后验概率能量函数E<sub>Likelihood</sub>(V):根据步骤S1通过变换得到的四个虚拟视角,采用贝叶斯原理重新生成视频对应帧的融合部分,理想的融合结果V构建成如下形式:E<sub>Likelihood</sub>(V)=ω<sub>1</sub>(V<sub>ti</sub>‑I<sub>(t1)i</sub>)<sup>2</sup>+ω<sub>2</sub>(V<sub>ti</sub>‑I<sub>(t2)i</sub>)<sup>2</sup>+ω<sub>3</sub>(V<sub>ti</sub>‑I<sub>(t3)i</sub>)<sup>2</sup>+ω<sub>4</sub>(V<sub>ti</sub>‑I<sub>(t4)i</sub>)<sup>2</sup>+ω<sub>5</sub>(V<sub>ti</sub>‑V<sub>(t‑1)i</sub>)<sup>2</sup>其中,前四项函数的建立是基于流场估计误差所产生的像素强度差值;为了消除视频输出的闪烁,增强视频的稳定性,将时间域的平滑即第五项函数加入似然能量函数数据项,其中V<sub>t‑1</sub>为视频流对应前一帧拼接结果,式中ω表示待拼接图像中每个像素对应的可靠性,i表示图像中对应的像素点,具体地:ω<sub>1</sub>=a/((I<sub>tRi</sub>‑I<sub>(t1)i</sub>)<sup>2</sup>+b);ω<sub>2</sub>=a/((I<sub>tRi</sub>‑I<sub>(t2)i</sub>)<sup>2</sup>+b);ω<sub>3</sub>=a/((I<sub>tLi</sub>‑I<sub>(t3)i</sub>)<sup>2</sup>+<sup>b</sup>);ω<sub>4</sub>=a/((I<sub>tLi</sub>‑I<sub>(t4)i</sub>)<sup>2</sup>+b);ω<sub>5</sub>=a/((V<sub>(t‑1)i</sub>‑V<sub>(t‑2)i</sub>)<sup>2</sup>+b);式中a和b取决于Gamma分布中的高阶参数α,β;S22:获得图像先验能量函数E<sub>prior</sub>(V):<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><msub><mi>E</mi><mrow><mi>p</mi><mi>r</mi><mi>i</mi><mi>o</mi><mi>r</mi></mrow></msub><mrow><mo>(</mo><mi>V</mi><mo>)</mo></mrow><mo>=</mo><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><mo>|</mo><msub><mi>V</mi><mrow><mi>t</mi><mi>i</mi></mrow></msub><mo>-</mo><msub><mi>V</mi><mrow><mi>t</mi><mi>j</mi></mrow></msub><mo>|</mo><mo>,</mo><mrow><mo>(</mo><mi>j</mi><mo>&Element;</mo><msub><mi>N</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>;</mo></mrow>]]></math><img file="FDA0000898569180000011.GIF" wi="637" he="134" /></maths>S23:根据步骤S31和S32得到能量函数E(V):E(V)=E<sub>Likelihood</sub>(V)+E<sub>Prior</sub>(V);S3:将能量函数等效为标签问题最小化,构件图模型,采用graph‑cuts进行求解;S4:视频拼接输出显示:对视频每一对应帧拼接,获得连续的全景视频序列。
地址 610041 四川省成都市高新区(西区)西源大道2006号