发明名称 基于压缩感知的视频图像帧间运动估计方法
摘要 本发明公开了一种基于压缩感知的视频图像帧间运动估计方法,主要解决现有技术在编码过程中难以直接利用运动后宏块测量值进行运动估计的问题。其实现步骤为:(1)对视频序列分组,组内划分参考帧与非参考帧;(2)对每一帧图像进行分块得到每个宏块的列向量;(3)对每一宏块进行压缩感知测量得到各个宏块测量值和运动后宏块的估计测量值;(4)根据衡量估计测量值与真实测量值差异程度的代价函数寻找最优运动估计向量。本发明提出的运动估计方法提取了视频编码过程中的运动信息,减少了编码端所需传输的数据量,可用在压缩感知的视频编解码中。
申请公布号 CN102946539B 申请公布日期 2015.07.15
申请号 CN201210476441.X 申请日期 2012.11.21
申请人 西安电子科技大学 发明人 宋彬;李玲泉;郭洁;秦浩;刘海啸
分类号 H04N19/51(2014.01)I;H04N19/154(2014.01)I 主分类号 H04N19/51(2014.01)I
代理机构 陕西电子工业专利中心 61205 代理人 王品华;朱红星
主权项 一种基于压缩感知的视频图像帧间运动估计方法,包括:(1)将视频图像中连续的N帧分为一组,每一组图像的第一帧作为参考帧,其余N‑1帧作为非参考帧,其中N为大于等于2的自然数;(2)将每组视频图像中的参考帧和非参考帧分成n个大小相同,互不重叠的宏块,对每个宏块进行二维到一维变换,得到每个宏块的列向量,其中n为大于1的自然数;(3)基于压缩感知理论,对所有宏块用相同的测量矩阵进行测量,得到每个宏块的测量值;(4)在参考帧中搜索与非参考帧当前宏块最匹配的宏块,找出最优估计运动向量:4a)建立参考帧中某一宏块运动后像素域向量与步骤(2)所划分宏块像素域向量之间的位置关系模型:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>x</mi><mi>f</mi></msub><mrow><mo>(</mo><mi>B</mi><mo>+</mo><mi>mv</mi><mo>)</mo></mrow><mo>=</mo><msubsup><mi>&Gamma;</mi><mi>mv</mi><mn>1</mn></msubsup><mo>&CenterDot;</mo><msub><mi>x</mi><mi>f</mi></msub><mrow><mo>(</mo><mi>B</mi><mo>)</mo></mrow><mo>+</mo><msubsup><mi>&Gamma;</mi><mi>mv</mi><mn>2</mn></msubsup><mo>&CenterDot;</mo><msub><mi>x</mi><mi>f</mi></msub><mrow><mo>(</mo><msub><mi>B</mi><mi>T</mi></msub><mo>)</mo></mrow><mo>+</mo><msubsup><mi>&Gamma;</mi><mi>mv</mi><mn>3</mn></msubsup><mo>&CenterDot;</mo><msub><mi>x</mi><mi>f</mi></msub><mrow><mo>(</mo><msub><mi>B</mi><mi>R</mi></msub><mo>)</mo></mrow><mo>+</mo><msubsup><mi>&Gamma;</mi><mi>mv</mi><mn>4</mn></msubsup><mo>&CenterDot;</mo><msub><mi>x</mi><mi>f</mi></msub><mrow><mo>(</mo><msub><mi>B</mi><mi>TR</mi></msub><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000635451480000011.GIF" wi="1640" he="97" /></maths>其中,B表示参考帧中与非参考帧中当前块对应位置的宏块;mv是宏块B的一个运动向量;B+mv表示宏块B偏移运动向量mv后得到的宏块,运动后宏块B+mv覆盖了步骤(2)所划分宏块中最多的四个宏块;x<sub>f</sub>(·)表示宏块对应的像素域向量;<img file="FDA0000635451480000012.GIF" wi="104" he="78" />i=1,2,3,4是由运动向量mv确定的位置关系矩阵;B<sub>T</sub>表示运动后宏块B+mv所覆盖的宏块中与宏块B垂直方向相邻的宏块,B<sub>R</sub>表示运动后宏块B+mv所覆盖的宏块中与宏块B水平方向相邻的宏块,B<sub>TR</sub>表示运动后宏块B+mv所覆盖的宏块中与宏块B对角的宏块;4b)根据步骤(3)中所得到的相应宏块的测量值,在参考帧中估计运动后宏块B+mv的测量值<img file="FDA0000635451480000013.GIF" wi="261" he="78" /><maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><msub><mover><mi>y</mi><mo>~</mo></mover><mi>f</mi></msub><mrow><mo>(</mo><mi>B</mi><mo>+</mo><mi>mv</mi><mo>)</mo></mrow><mo>=</mo><msubsup><mi>&Lambda;</mi><mi>mv</mi><mn>1</mn></msubsup><mo>&CenterDot;</mo><msub><mi>y</mi><mi>f</mi></msub><mrow><mo>(</mo><mi>B</mi><mo>)</mo></mrow><mo>+</mo><msubsup><mi>&Lambda;</mi><mi>mv</mi><mn>2</mn></msubsup><mo>&CenterDot;</mo><msub><mi>y</mi><mi>f</mi></msub><mrow><mo>(</mo><msub><mi>B</mi><mi>T</mi></msub><mo>)</mo></mrow><mo>+</mo><msubsup><mi>&Lambda;</mi><mi>mv</mi><mn>3</mn></msubsup><mo>&CenterDot;</mo><msub><mi>y</mi><mi>f</mi></msub><mrow><mo>(</mo><msub><mi>B</mi><mi>R</mi></msub><mo>)</mo></mrow><mo>+</mo><msubsup><mi>&Lambda;</mi><mi>mv</mi><mn>4</mn></msubsup><mo>&CenterDot;</mo><msub><mi>y</mi><mi>f</mi></msub><mrow><mo>(</mo><msub><mi>B</mi><mi>TR</mi></msub><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000635451480000014.GIF" wi="1451" he="101" /></maths>其中,y<sub>f</sub>(B)表示参考帧中宏块B的测量值,y<sub>f</sub>(B<sub>T</sub>)表示参考帧中宏块B<sub>T</sub>的测量值,y<sub>f</sub>(B<sub>R</sub>)表示宏块B<sub>R</sub>的测量值,y<sub>f</sub>(B<sub>TR</sub>)表示宏块B<sub>TR</sub>的测量值;<img file="FDA0000635451480000015.GIF" wi="237" he="86" /><img file="FDA0000635451480000021.GIF" wi="232" he="78" />是由运动向量和测量矩阵确定的加权系数矩阵:<img file="FDA0000635451480000022.GIF" wi="422" he="78" />i=1,2,3,4,其中,Φ为步骤(3)中所用的测量矩阵,该矩阵是由哈达玛矩阵取出的部分矩阵构成,即部分哈达玛矩阵,Φ<sup>+</sup>表示测量矩阵Φ的伪逆;4c)根据参考帧中估计运动后宏块B+mv的测量值<img file="FDA0000635451480000023.GIF" wi="266" he="79" />在参考帧中搜索与非参考帧当前宏块最匹配的块,找出最优估计运动向量MV<sub>B′</sub>:<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><msub><mi>MV</mi><msup><mi>B</mi><mo>&prime;</mo></msup></msub><mo>=</mo><mi>arg</mi><munder><mi>min</mi><mrow><mi>mv</mi><mo>&Element;</mo><mi>SW</mi></mrow></munder><mi>&Delta;</mi><mrow><mo>(</mo><mover><mi>y</mi><mo>~</mo></mover><mrow><mo>(</mo><mi>B</mi><mo>+</mo><mi>mv</mi><mo>)</mo></mrow><mo>-</mo><mi>y</mi><mrow><mo>(</mo><msup><mi>B</mi><mo>&prime;</mo></msup><mo>)</mo></mrow><mo>)</mo></mrow><mo>,</mo></mrow>]]></math><img file="FDA0000635451480000024.GIF" wi="936" he="108" /></maths>其中,B′表示非参考帧中的当前宏块,y(B′)表示宏块B′的真实测量值,SW表示参考帧中搜索窗口;<img file="FDA0000635451480000025.GIF" wi="450" he="78" />表示评价两个测量值<img file="FDA0000635451480000026.GIF" wi="212" he="73" />和y(B′)差异程度的代价函数,arg min表示求解使后面表达式取最小值的参数mv值。
地址 710071 陕西省西安市太白南路2号