发明名称 基于3D视频的时空域运动分割与运动估计方法
摘要 本发明公开了一种基于3D视频的时空域运动分割与运动估计方法,其实施步骤如下:1)通过3D视频获取系统获取包含运动目标和背景区域的3D视频;2)建立基于背景三维运动特性的二维运动场参数模型;3)定义分割曲面,将所述二维运动场参数模型和分割曲面嵌入活动轮廓模型得到基于时空域的目标函数;4)对所述目标函数进行最小化求解得到3D视频获取系统的运动参数、运动目标的运动参数以及目标曲面。本发明具有运动分析准确可靠、鲁棒性高、无摄像机运动先验依赖、适合复杂运动、应用范围广的优点。
申请公布号 CN102521846B 申请公布日期 2013.12.04
申请号 CN201110431984.5 申请日期 2011.12.21
申请人 浙江大学 发明人 于慧敏;王诗言
分类号 G06T7/20(2006.01)I;G06T7/00(2006.01)I;H04N13/00(2006.01)I 主分类号 G06T7/20(2006.01)I
代理机构 杭州天勤知识产权代理有限公司 33224 代理人 胡红娟
主权项 1.一种基于3D视频的时空域运动分割与运动估计方法,其特征在于其实施步骤如下:1)通过3D视频获取系统获取包含运动目标和背景区域的3D视频;2)建立基于背景三维运动特性的二维运动场参数模型;所述二维运动场参数模型的约束方程为:I<sub>op</sub>(T,W,x)=I<sub>x</sub>×f<sub>u</sub>(T,W)+I<sub>y</sub>×f<sub>v</sub>(T,W)+I<sub>t</sub>=0其中I<sub>op</sub>(T,W,x)为3D视频的每一帧图像中像素点x上的光强变化,I<sub>x</sub>为图像灰度的横向差分,I<sub>y</sub>为图像灰度的纵向差分,I<sub>t</sub>为图像灰度的时间差分,T为三维运动的平移变量,W为三维运动的旋转变量,f<sub>u</sub>(T,W)为像素点x在x方向上的光流与平移变量T、旋转变量W的关系,f<sub>v</sub>(T,W)为像素点x在y方向上的光流与平移变量T、旋转变量W的关系,且f<sub>u</sub>(T,W)和f<sub>v</sub>(T,W)的表达式为<maths num="0001"><![CDATA[<math><mrow><msub><mi>f</mi><mi>u</mi></msub><mrow><mo>(</mo><mi>T</mi><mo>,</mo><mi>W</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><msub><mrow><mo>-</mo><mi>yw</mi></mrow><mn>3</mn></msub><mo>-</mo><msub><mi>xyw</mi><mn>1</mn></msub><mo>+</mo><mrow><mo>(</mo><mn>1</mn><mo>+</mo><msup><mi>x</mi><mn>2</mn></msup><mo>)</mo></mrow><msub><mi>w</mi><mn>2</mn></msub><mo>+</mo><mrow><mo>(</mo><msub><mi>t</mi><mn>1</mn></msub><mo>-</mo><msub><mi>xt</mi><mn>3</mn></msub><mo>)</mo></mrow><mo>/</mo><mi>Z</mi></mrow><mrow><mn>1</mn><mo>-</mo><msub><mi>xw</mi><mn>2</mn></msub><mo>+</mo><msub><mi>yw</mi><mn>1</mn></msub><mo>+</mo><msub><mi>t</mi><mn>3</mn></msub><mo>/</mo><mi>Z</mi></mrow></mfrac></mrow></math>]]></maths><maths num="0002"><![CDATA[<math><mrow><msub><mi>f</mi><mi>v</mi></msub><mrow><mo>(</mo><mi>T</mi><mo>,</mo><mi>W</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><msub><mi>xw</mi><mn>3</mn></msub><mo>+</mo><msub><mi>xyw</mi><mn>2</mn></msub><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>+</mo><msup><mi>y</mi><mn>2</mn></msup><mo>)</mo></mrow><msub><mi>w</mi><mn>1</mn></msub><mo>+</mo><mrow><mo>(</mo><msub><mi>t</mi><mn>2</mn></msub><mo>-</mo><msub><mi>yt</mi><mn>3</mn></msub><mo>)</mo></mrow><mo>/</mo><mi>Z</mi></mrow><mrow><mn>1</mn><mo>-</mo><msub><mi>xw</mi><mn>2</mn></msub><mo>+</mo><msub><mi>yw</mi><mn>1</mn></msub><mo>+</mo><msub><mi>t</mi><mn>3</mn></msub><mo>/</mo><mi>Z</mi></mrow></mfrac></mrow></math>]]></maths>其中t<sub>1</sub>,t<sub>2</sub>,t<sub>3</sub>分别代表平移变量T在x,y,z轴方向的值,w<sub>1</sub>,w<sub>2</sub>,w<sub>3</sub>分别代表旋转变量W在x,y,z轴方向的值,x为像素点在图像坐标中的x轴坐标值,y为像素点在图像坐标中的y轴坐标值,Z为像素点在空间坐标中的z轴坐标值;3)定义分割曲面,将所述二维运动场参数模型和分割曲面嵌入活动轮廓模型得到基于时空域的目标函数;所述目标函数的表达式为:<maths num="0003"><![CDATA[<math><mrow><mi>E</mi><mrow><mo>(</mo><mi>S</mi><mo>,</mo><mi>T</mi><mo>,</mo><mi>W</mi><mo>)</mo></mrow><mo>=</mo><munder><mo>&Integral;</mo><msub><mrow><mi>x</mi><mo>&Element;</mo><mi>&Omega;</mi></mrow><mi>bg</mi></msub></munder><msub><mi>g</mi><mi>bg</mi></msub><mrow><mo>(</mo><msubsup><mi>I</mi><mi>op</mi><mn>2</mn></msubsup><mrow><mo>(</mo><mi>T</mi><mo>,</mo><mi>W</mi><mo>,</mo><mi>x</mi><mo>)</mo></mrow><mo>)</mo></mrow><mi>dx</mi><mo>+</mo><munder><mo>&Integral;</mo><msub><mrow><mi>x</mi><mo>&Element;</mo><mi>&Omega;</mi></mrow><mi>fg</mi></msub></munder><msub><mi>g</mi><mi>fg</mi></msub><mrow><mo>(</mo><msubsup><mi>I</mi><mi>op</mi><mn>2</mn></msubsup><mrow><mo>(</mo><mi>T</mi><mo>,</mo><mi>W</mi><mo>,</mo><mi>x</mi><mo>)</mo></mrow><mo>)</mo></mrow><mi>dx</mi><mo>+</mo><mi>&lambda;</mi><munder><mo>&Integral;</mo><mi>S</mi></munder><mi>dx</mi></mrow></math>]]></maths>其中S为分割曲面,I<sub>op</sub>(T,W,x)为步骤2)得到的约束方程,<img file="FDA00003608198600014.GIF" wi="481" he="143" />为背景区域的积分项,<img file="FDA00003608198600015.GIF" wi="484" he="147" />为前景区域的积分项,<img file="FDA00003608198600016.GIF" wi="126" he="130" />为曲面的平滑项,g<sub>bg</sub>为背景区域观察函数,g<sub>fg</sub>为前景区域观察函数,λ为比例因子;其中背景区域观察函数g<sub>bg</sub>需要满足以下条件:g<sub>bg</sub>(0)=0,g<sub>bg</sub>(∞)=c且g<sub>bg</sub>(x)在[0,∞)上单调递增,同样的,前景区域观察函数g<sub>fg</sub>需满足以下条件:g<sub>fg</sub>(0)=c,g<sub>fg</sub>(∞)=0且g<sub>fg</sub>(x)在[0,∞)上单调递减,其中c为正常数;4)对所述目标函数进行最小化求解得到3D视频获取系统的运动参数、运动目标的运动参数以及目标曲面;对目标函数进行最小化求解的详细步骤为:A)初始化目标曲面和运动参数;B)固定目标曲面,使用最速下降法迭代获取背景的运动参数;迭代获取背景的运动参数时使用的迭代公式为<maths num="0004"><![CDATA[<math><mfenced open='{' close=''><mtable><mtr><mtd><msubsup><mi>t</mi><mi>i</mi><mrow><mi>n</mi><mo>+</mo><mn>1</mn></mrow></msubsup><mo>=</mo><msubsup><mi>t</mi><mi>i</mi><mi>n</mi></msubsup><mo>+</mo><mi>&Delta;t</mi><mo>&CenterDot;</mo><mfrac><msubsup><mrow><mo>&PartialD;</mo><mi>t</mi></mrow><mi>i</mi><mi>n</mi></msubsup><mrow><mo>&PartialD;</mo><mi>&tau;</mi></mrow></mfrac><mo>,</mo><mi>i</mi><mo>=</mo><mn>1,2,3</mn></mtd></mtr><mtr><mtd><msubsup><mi>&omega;</mi><mi>i</mi><mrow><mi>n</mi><mo>+</mo><mn>1</mn></mrow></msubsup><mo>=</mo><msubsup><mi>&omega;</mi><mi>i</mi><mi>n</mi></msubsup><mo>+</mo><mi>&Delta;t</mi><mo>&CenterDot;</mo><mfrac><msubsup><mrow><mo>&PartialD;</mo><mi>&omega;</mi></mrow><mi>i</mi><mi>n</mi></msubsup><mrow><mo>&PartialD;</mo><mi>&tau;</mi></mrow></mfrac><mo>,</mo><mi>i</mi><mo>=</mo><mn>1,2,3</mn></mtd></mtr></mtable></mfenced></math>]]></maths>其中i代表平移变量T、旋转变量W的第i个变量,Δt为迭代步长,<img file="FDA00003608198600022.GIF" wi="43" he="72" />为平移变量T的第i个变量在第n次迭代时的值,<img file="FDA00003608198600023.GIF" wi="74" he="77" />为平移变量T的第i个变量在第n+1次迭代时的值,<img file="FDA00003608198600024.GIF" wi="65" he="69" />为旋转变量W的第i个变量在第n次迭代时的值,<img file="FDA00003608198600025.GIF" wi="84" he="77" />为旋转变量W的第i个变量在第n+1次迭代时的值,<img file="FDA00003608198600026.GIF" wi="85" he="120" />为平移变量T的第i个变量在第n次迭代时的梯度,<img file="FDA00003608198600027.GIF" wi="84" he="121" />为旋转变量W的第i个变量在第n次迭代时的梯度,τ为时间步长;C)固定运动参数,使用窄带水平集方法演化获取运动目标的目标曲面;演化获取运动目标的目标曲面时,曲面演化的偏微分方程为<maths num="0005"><![CDATA[<math><mrow><mfrac><mrow><mo>&PartialD;</mo><mi>&phi;</mi></mrow><mrow><mo>&PartialD;</mo><mi>&tau;</mi></mrow></mfrac><mo>=</mo><mo>-</mo><mfrac><mrow><mo>&PartialD;</mo><mi>S</mi></mrow><mrow><mo>&PartialD;</mo><mi>&tau;</mi></mrow></mfrac><mo>&dtri;</mo><mi>&phi;</mi><mo>=</mo><mi>f</mi><mrow><mo>(</mo><mi>S</mi><mo>,</mo><mi>T</mi><mo>,</mo><mi>W</mi><mo>)</mo></mrow><mo>|</mo><mo>&dtri;</mo><mi>&phi;</mi><mo>|</mo></mrow></math>]]></maths>其中τ为时间步长,<img file="FDA00003608198600029.GIF" wi="60" he="98" />为符号距离函数对时间步长的偏微分,<img file="FDA000036081986000210.GIF" wi="59" he="99" />为曲面对时间步长的偏微分,φ为表示水平集的符号距离函数,<img file="FDA000036081986000211.GIF" wi="58" he="54" />为符号距离函数的梯度,<img file="FDA000036081986000212.GIF" wi="75" he="68" />为符号距离函数的梯度的模,驱动曲面演化的作用力f(S,T,W)的表达式为f(S,T,W)=-g<sub>bg</sub>(·)+g<sub>fg</sub>(·)+λ·κ,g<sub>bg</sub>(·)为背景区域观察函数,g<sub>fg</sub>(·)为前景区域观察函数,λ为比例因子,κ为目标曲面的曲率;D)得到目标曲面后,分别对每个目标根据步骤2)得到的约束方程估计运动目标的运动参数。
地址 310027 浙江省杭州市西湖区浙大路38号