主权项 |
一种基于压缩感知的视频图像帧间运动估计方法,包括:(1)将视频图像中连续的N帧分为一组,每一组图像的第一帧作为参考帧,其余N‑1帧作为非参考帧,其中N为大于等于2的自然数;(2)将每组视频图像中的参考帧和非参考帧分成n个大小相同,互不重叠的宏块,对每个宏块进行二维到一维变换,得到每个宏块的列向量,其中n为大于1的自然数;(3)基于压缩感知理论,对所有宏块用相同的测量矩阵进行测量,得到每个宏块的测量值;(4)在参考帧中搜索与非参考帧当前宏块最匹配的宏块,找出最优估计运动向量:4a)建立参考帧中某一宏块运动后像素域向量与步骤(2)所划分宏块像素域向量之间的位置关系模型:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>x</mi><mi>f</mi></msub><mrow><mo>(</mo><mi>B</mi><mo>+</mo><mi>mv</mi><mo>)</mo></mrow><mo>=</mo><msubsup><mi>Γ</mi><mi>mv</mi><mn>1</mn></msubsup><mo>·</mo><msub><mi>x</mi><mi>f</mi></msub><mrow><mo>(</mo><mi>B</mi><mo>)</mo></mrow><mo>+</mo><msubsup><mi>Γ</mi><mi>mv</mi><mn>2</mn></msubsup><mo>·</mo><msub><mi>x</mi><mi>f</mi></msub><mrow><mo>(</mo><msub><mi>B</mi><mi>T</mi></msub><mo>)</mo></mrow><mo>+</mo><msubsup><mi>Γ</mi><mi>mv</mi><mn>3</mn></msubsup><mo>·</mo><msub><mi>x</mi><mi>f</mi></msub><mrow><mo>(</mo><msub><mi>B</mi><mi>R</mi></msub><mo>)</mo></mrow><mo>+</mo><msubsup><mi>Γ</mi><mi>mv</mi><mn>4</mn></msubsup><mo>·</mo><msub><mi>x</mi><mi>f</mi></msub><mrow><mo>(</mo><msub><mi>B</mi><mi>TR</mi></msub><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000635451480000011.GIF" wi="1640" he="97" /></maths>其中,B表示参考帧中与非参考帧中当前块对应位置的宏块;mv是宏块B的一个运动向量;B+mv表示宏块B偏移运动向量mv后得到的宏块,运动后宏块B+mv覆盖了步骤(2)所划分宏块中最多的四个宏块;x<sub>f</sub>(·)表示宏块对应的像素域向量;<img file="FDA0000635451480000012.GIF" wi="104" he="78" />i=1,2,3,4是由运动向量mv确定的位置关系矩阵;B<sub>T</sub>表示运动后宏块B+mv所覆盖的宏块中与宏块B垂直方向相邻的宏块,B<sub>R</sub>表示运动后宏块B+mv所覆盖的宏块中与宏块B水平方向相邻的宏块,B<sub>TR</sub>表示运动后宏块B+mv所覆盖的宏块中与宏块B对角的宏块;4b)根据步骤(3)中所得到的相应宏块的测量值,在参考帧中估计运动后宏块B+mv的测量值<img file="FDA0000635451480000013.GIF" wi="261" he="78" /><maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><msub><mover><mi>y</mi><mo>~</mo></mover><mi>f</mi></msub><mrow><mo>(</mo><mi>B</mi><mo>+</mo><mi>mv</mi><mo>)</mo></mrow><mo>=</mo><msubsup><mi>Λ</mi><mi>mv</mi><mn>1</mn></msubsup><mo>·</mo><msub><mi>y</mi><mi>f</mi></msub><mrow><mo>(</mo><mi>B</mi><mo>)</mo></mrow><mo>+</mo><msubsup><mi>Λ</mi><mi>mv</mi><mn>2</mn></msubsup><mo>·</mo><msub><mi>y</mi><mi>f</mi></msub><mrow><mo>(</mo><msub><mi>B</mi><mi>T</mi></msub><mo>)</mo></mrow><mo>+</mo><msubsup><mi>Λ</mi><mi>mv</mi><mn>3</mn></msubsup><mo>·</mo><msub><mi>y</mi><mi>f</mi></msub><mrow><mo>(</mo><msub><mi>B</mi><mi>R</mi></msub><mo>)</mo></mrow><mo>+</mo><msubsup><mi>Λ</mi><mi>mv</mi><mn>4</mn></msubsup><mo>·</mo><msub><mi>y</mi><mi>f</mi></msub><mrow><mo>(</mo><msub><mi>B</mi><mi>TR</mi></msub><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000635451480000014.GIF" wi="1451" he="101" /></maths>其中,y<sub>f</sub>(B)表示参考帧中宏块B的测量值,y<sub>f</sub>(B<sub>T</sub>)表示参考帧中宏块B<sub>T</sub>的测量值,y<sub>f</sub>(B<sub>R</sub>)表示宏块B<sub>R</sub>的测量值,y<sub>f</sub>(B<sub>TR</sub>)表示宏块B<sub>TR</sub>的测量值;<img file="FDA0000635451480000015.GIF" wi="237" he="86" /><img file="FDA0000635451480000021.GIF" wi="232" he="78" />是由运动向量和测量矩阵确定的加权系数矩阵:<img file="FDA0000635451480000022.GIF" wi="422" he="78" />i=1,2,3,4,其中,Φ为步骤(3)中所用的测量矩阵,该矩阵是由哈达玛矩阵取出的部分矩阵构成,即部分哈达玛矩阵,Φ<sup>+</sup>表示测量矩阵Φ的伪逆;4c)根据参考帧中估计运动后宏块B+mv的测量值<img file="FDA0000635451480000023.GIF" wi="266" he="79" />在参考帧中搜索与非参考帧当前宏块最匹配的块,找出最优估计运动向量MV<sub>B′</sub>:<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><msub><mi>MV</mi><msup><mi>B</mi><mo>′</mo></msup></msub><mo>=</mo><mi>arg</mi><munder><mi>min</mi><mrow><mi>mv</mi><mo>∈</mo><mi>SW</mi></mrow></munder><mi>Δ</mi><mrow><mo>(</mo><mover><mi>y</mi><mo>~</mo></mover><mrow><mo>(</mo><mi>B</mi><mo>+</mo><mi>mv</mi><mo>)</mo></mrow><mo>-</mo><mi>y</mi><mrow><mo>(</mo><msup><mi>B</mi><mo>′</mo></msup><mo>)</mo></mrow><mo>)</mo></mrow><mo>,</mo></mrow>]]></math><img file="FDA0000635451480000024.GIF" wi="936" he="108" /></maths>其中,B′表示非参考帧中的当前宏块,y(B′)表示宏块B′的真实测量值,SW表示参考帧中搜索窗口;<img file="FDA0000635451480000025.GIF" wi="450" he="78" />表示评价两个测量值<img file="FDA0000635451480000026.GIF" wi="212" he="73" />和y(B′)差异程度的代价函数,arg min表示求解使后面表达式取最小值的参数mv值。 |