发明名称 时空多尺度运动目标检测方法
摘要 本发明公开了一种时空多尺度运动目标检测方法,采用多尺度图像分块,以及子块重叠逼近潜在运动目标区大小的思想,寻找适合运动目标的最合适的分块大小和分块位置,来检验和定位不同大小的运动目标的运动区域;针对空间多尺度运动显著性检验所得到的运动区域,对其进行时间多尺度差分处理,由小到大调整帧间差分间隔,搜寻每个运动区域内达到最优运动显著性状态时的帧间间隔,从而实现检测和跟踪出各个运动目标。本发明同时考虑了空间多尺度和时间多尺度,能够检测出复杂背景图象中具有不同位置、尺寸和运动速度的多个运动目标。
申请公布号 CN103077534A 申请公布日期 2013.05.01
申请号 CN201210591104.5 申请日期 2012.12.31
申请人 南京华图信息技术有限公司 发明人 张天序
分类号 G06T7/20(2006.01)I 主分类号 G06T7/20(2006.01)I
代理机构 华中科技大学专利中心 42201 代理人 李智
主权项 1.一种时空多尺度运动目标检测方法,具体为:(1)确定M个窗口,其尺寸从小到大依次为:(S<sub>min_x</sub>,S<sub>min_y</sub>),(S<sub>min_x</sub>+ΔS<sub>x</sub>,S<sub>min_y</sub>+ΔS<sub>y</sub>),…,(S<sub>min_x</sub>+(M-1)ΔS<sub>x</sub>,S<sub>min_y</sub>+(M-1)ΔS<sub>y</sub>);(2)利用最小窗口(S<sub>min_x</sub>,S<sub>min_y</sub>)分别对t时刻的帧图像f<sub>t</sub>(x,y)和t+Δt时刻的帧图像f<sub>t+Δt</sub>(x,y)逐像素点遍历,得到每一像素点(x,y)对应的窗口区域<img file="FDA00002693115800011.GIF" wi="63" he="56" />和<img file="FDA00002693115800012.GIF" wi="115" he="59" />(3)计算最小窗口(S<sub>min_x</sub>,S<sub>min_y</sub>)在像素点(x,y)处的覆盖区域Ω<sub>x,y</sub>的运动显著性度量值Value<sub>change</sub>(x,y)=Diff<sub>gray</sub>(x,y)<sup>1/α</sup>×Diff<sub>area</sub>(x,y)<sup>1/β</sup>,其中,<maths num="0001"><![CDATA[<math><mrow><msub><mi>Diff</mi><mi>gray</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><munder><mi>&Sigma;</mi><mrow><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>&Element;</mo><msub><mi>&Omega;</mi><mrow><mi>x</mi><mo>,</mo><mi>y</mi></mrow></msub></mrow></munder><mo>|</mo><msub><mi>f</mi><mi>t</mi></msub><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>-</mo><msub><mi>f</mi><mrow><mi>t</mi><mo>+</mo><mi>&Delta;t</mi></mrow></msub><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo></mrow><mrow><munder><mi>&Sigma;</mi><mrow><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>&Element;</mo><msub><mi>&Omega;</mi><mrow><mi>x</mi><mo>,</mo><mi>y</mi></mrow></msub></mrow></munder><msub><mi>MAX</mi><mi>gray</mi></msub></mrow></mfrac><mo>,</mo></mrow></math>]]></maths><maths num="0002"><![CDATA[<math><mrow><msub><mi>Diff</mi><mi>area</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><munder><mi>&Sigma;</mi><mrow><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>&Element;</mo><msub><mi>&Omega;</mi><mrow><mi>x</mi><mo>,</mo><mi>y</mi></mrow></msub></mrow></munder><mi>&delta;</mi><mrow><mo>(</mo><msub><mi>f</mi><mi>t</mi></msub><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>,</mo><msub><mi>f</mi><mrow><mi>t</mi><mo>+</mo><mi>&Delta;t</mi></mrow></msub><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>)</mo></mrow></mrow><msub><mi>MAX</mi><mi>area</mi></msub></mfrac><mo>,</mo></mrow></math>]]></maths>MAX<sub>gray</sub>为帧图像的像素点最大灰度值,MAX<sub>area</sub>为最大窗口(S<sub>min_x</sub>+(M-1)ΔS<sub>x</sub>,S<sub>min_y</sub>+(M-1)ΔS<sub>y</sub>)覆盖的图像区域的像素点总数,α和β为大于零的常数,<maths num="0003"><![CDATA[<math><mrow><mi>&delta;</mi><mrow><mo>(</mo><mi>p</mi><mo>,</mo><mi>q</mi><mo>)</mo></mrow><mo>=</mo><mfenced open='{' close=''><mtable><mtr><mtd><mn>1</mn><mo>,</mo><mi>p</mi><mo>&NotEqual;</mo><mi>q</mi></mtd></mtr><mtr><mtd><mn>0</mn><mo>,</mo><mi>p</mi><mo>=</mo><mi>q</mi></mtd></mtr></mtable></mfenced><mo>;</mo></mrow></math>]]></maths>(4)若运动显著性度量值Value<sub>change</sub>(x,y)大于等于预定阈值,则认定区域Ω<sub>x,y</sub>属于运动显著性区域,否则,区域Ω<sub>x,y</sub>不属于运动显著性区域;记属于运动显著性区域Ω<sub>x,y</sub>对应的像素点为运动标记像素点(x′,y′);(5)利用窗口(S<sub>min_x</sub>+mΔS<sub>x</sub>,S<sub>min_y</sub>+mS<sub>y</sub>),m=1,…,M-1对图像f<sub>t</sub>(x,y)和图像<img file="FDA00002693115800016.GIF" wi="203" he="54" />的运动标记像素点(x′,y′)进行遍历,得到每一运动标记像素点对应的窗口区域<img file="FDA00002693115800017.GIF" wi="76" he="57" />和<img file="FDA00002693115800018.GIF" wi="115" he="60" />(6)计算窗口(S<sub>min_x</sub>+mΔS<sub>x</sub>,S<sub>min_y</sub>+mS<sub>y</sub>),m=1,…,M-1在运动标记像素点(x′,y′)处的覆盖区域<img file="FDA00002693115800021.GIF" wi="89" he="88" />的运动显著性度量值<maths num="0004"><![CDATA[<math><mrow><msup><msub><mi>Value</mi><mi>change</mi></msub><msubsup><mi>&Omega;</mi><mrow><msup><mi>x</mi><mo>&prime;</mo></msup><mo>,</mo><msup><mi>y</mi><mo>&prime;</mo></msup></mrow><mi>m</mi></msubsup></msup><mrow><mo>(</mo><msup><mi>x</mi><mo>&prime;</mo></msup><mo>,</mo><msup><mi>y</mi><mo>&prime;</mo></msup><mo>)</mo></mrow><mo>=</mo><msup><msub><mi>Diff</mi><mi>gray</mi></msub><msubsup><mi>&Omega;</mi><mrow><msup><mi>x</mi><mo>&prime;</mo></msup><mo>,</mo><msup><mi>y</mi><mo>&prime;</mo></msup></mrow><mi>m</mi></msubsup></msup><msup><mrow><mo>(</mo><msup><mi>x</mi><mo>&prime;</mo></msup><mo>,</mo><msup><mi>y</mi><mo>&prime;</mo></msup><mo>)</mo></mrow><mrow><mn>1</mn><mo>/</mo><mi>&alpha;</mi></mrow></msup><mo>&times;</mo><msup><msub><mi>Diff</mi><mi>area</mi></msub><msubsup><mi>&Omega;</mi><mrow><msup><mi>x</mi><mo>&prime;</mo></msup><mo>,</mo><msup><mi>y</mi><mo>&prime;</mo></msup></mrow><mi>m</mi></msubsup></msup><msup><mrow><mo>(</mo><msup><mi>x</mi><mo>&prime;</mo></msup><mo>,</mo><msup><mi>y</mi><mo>&prime;</mo></msup><mo>)</mo></mrow><mrow><mn>1</mn><mo>/</mo><mi>&beta;</mi></mrow></msup><mo>,</mo></mrow></math>]]></maths>其中,<maths num="0005"><![CDATA[<math><mrow><msup><msub><mi>Diff</mi><mi>gray</mi></msub><msubsup><mi>&Omega;</mi><mrow><msup><mi>x</mi><mo>&prime;</mo></msup><mo>,</mo><msup><mi>y</mi><mo>&prime;</mo></msup></mrow><mi>m</mi></msubsup></msup><msup><mrow><mo>(</mo><msup><mi>x</mi><mo>&prime;</mo></msup><mo>,</mo><msup><mi>y</mi><mo>&prime;</mo></msup><mo>)</mo></mrow><mrow><mn>1</mn><mo>/</mo><mi>&alpha;</mi></mrow></msup><mo>=</mo><mfrac><mrow><munder><mi>&Sigma;</mi><mrow><mrow><mo>(</mo><msup><mi>i</mi><mo>&prime;</mo></msup><mo>,</mo><msup><mi>j</mi><mo>&prime;</mo></msup><mo>)</mo></mrow><mo>&Element;</mo><msubsup><mi>&Omega;</mi><mrow><msup><mi>x</mi><mo>&prime;</mo></msup><mo>,</mo><msup><mi>y</mi><mo>&prime;</mo></msup></mrow><mi>m</mi></msubsup></mrow></munder><mi>&delta;</mi><mrow><mo>(</mo><msub><mi>f</mi><mi>t</mi></msub><mrow><mo>(</mo><msup><mi>i</mi><mo>&prime;</mo></msup><mo>,</mo><msup><mi>j</mi><mo>&prime;</mo></msup><mo>)</mo></mrow><mo>,</mo><msub><mi>f</mi><mrow><mi>t</mi><mo>+</mo><mi>&Delta;t</mi></mrow></msub><mrow><mo>(</mo><msup><mi>i</mi><mo>&prime;</mo></msup><mo>,</mo><msup><mi>j</mi><mo>&prime;</mo></msup><mo>)</mo></mrow><mo>)</mo></mrow></mrow><msub><mi>MAX</mi><mi>area</mi></msub></mfrac><mo>;</mo></mrow></math>]]></maths>(7)针对每一运动标记像素点(x′,y′),从其对应的M个运动显著性度量值即Value<sub>change</sub>(x′,y′)和<img file="FDA00002693115800024.GIF" wi="405" he="72" />中选取最大值,该最大值对应的覆盖区域即为运动显著性区域,记为ω<sub>x′,y′</sub>;(8)令帧间间隔Δt<sub>x′,y′</sub>从最小时间间隔Δt<sub>min</sub>向最大时间间隔Δt<sub>max</sub>逐渐增大,计算每一运动显著性区域ω<sub>x′,y′</sub>的运动显著性强度<maths num="0006"><![CDATA[<math><mrow><mi>s</mi><mrow><mo>(</mo><mi>&Delta;</mi><msub><mi>t</mi><mrow><msup><mi>x</mi><mo>&prime;</mo></msup><mo>,</mo><msup><mi>y</mi><mo>&prime;</mo></msup></mrow></msub><mo>)</mo></mrow><mo>=</mo><munder><mi>&Sigma;</mi><mrow><mrow><mo>(</mo><msup><mi>x</mi><mrow><mo>&prime;</mo><mo>&prime;</mo></mrow></msup><mo>,</mo><msup><mi>y</mi><mrow><mo>&prime;</mo><mo>&prime;</mo></mrow></msup><mo>)</mo></mrow><mo>&Element;</mo><msub><mi>&omega;</mi><mrow><msup><mi>x</mi><mo>&prime;</mo></msup><mo>,</mo><msup><mi>y</mi><mo>&prime;</mo></msup></mrow></msub></mrow></munder><mi>&delta;</mi><mrow><mo>(</mo><msub><mi>f</mi><mi>t</mi></msub><mrow><mo>(</mo><msup><mi>x</mi><mrow><mo>&prime;</mo><mo>&prime;</mo></mrow></msup><mo>,</mo><msup><mi>y</mi><mrow><mo>&prime;</mo><mo>&prime;</mo></mrow></msup><mo>)</mo></mrow><mo>,</mo><msub><mi>f</mi><mrow><mi>t</mi><mo>+</mo><mi>&Delta;</mi><msub><mi>t</mi><mrow><msup><mi>x</mi><mo>&prime;</mo></msup><mo>,</mo><msup><mi>y</mi><mo>&prime;</mo></msup></mrow></msub></mrow></msub><mrow><mo>(</mo><msup><mi>x</mi><mrow><mo>&prime;</mo><mo>&prime;</mo></mrow></msup><mo>,</mo><msup><mi>y</mi><mrow><mo>&prime;</mo><mo>&prime;</mo></mrow></msup><mo>)</mo></mrow><mo>)</mo></mrow></mrow></math>]]></maths>或<maths num="0007"><![CDATA[<math><mrow><mi>s</mi><mrow><mo>(</mo><mi>&Delta;</mi><msub><mi>t</mi><mrow><msup><mi>x</mi><mo>&prime;</mo></msup><mo>,</mo><msup><mi>y</mi><mo>&prime;</mo></msup></mrow></msub><mo>)</mo></mrow><mo>=</mo><munder><mi>&Sigma;</mi><mrow><mrow><mo>(</mo><msup><mi>x</mi><mrow><mo>&prime;</mo><mo>&prime;</mo></mrow></msup><mo>,</mo><msup><mi>y</mi><mrow><mo>&prime;</mo><mo>&prime;</mo></mrow></msup><mo>)</mo></mrow><mo>&Element;</mo><msub><mi>&omega;</mi><mrow><msup><mi>x</mi><mo>&prime;</mo></msup><mo>,</mo><msup><mi>y</mi><mo>&prime;</mo></msup></mrow></msub></mrow></munder><mi>&delta;</mi><mrow><mo>(</mo><msub><mi>f</mi><mi>t</mi></msub><mrow><mo>(</mo><msup><mi>x</mi><mrow><mo>&prime;</mo><mo>&prime;</mo></mrow></msup><mo>,</mo><msup><mi>y</mi><mrow><mo>&prime;</mo><mo>&prime;</mo></mrow></msup><mo>)</mo></mrow><mo>,</mo><msub><mi>f</mi><mrow><mi>t</mi><mo>-</mo><mi>&Delta;</mi><msub><mi>t</mi><mrow><msup><mi>x</mi><mo>&prime;</mo></msup><mo>,</mo><msup><mi>y</mi><mo>&prime;</mo></msup></mrow></msub></mrow></msub><mrow><mo>(</mo><msup><mi>x</mi><mrow><mo>&prime;</mo><mo>&prime;</mo></mrow></msup><mo>,</mo><msup><mi>y</mi><mrow><mo>&prime;</mo><mo>&prime;</mo></mrow></msup><mo>)</mo></mrow><mo>)</mo></mrow><mo>;</mo></mrow></math>]]></maths>当Δt<sub>x′,y′</sub>到达某一值时,s(Δt<sub>x′,y′</sub>)转为收敛状态即s(Δt<sub>x′,y′</sub>)的变化率趋近于零,则认定该值为ω<sub>x′,y′</sub>的最优时间间隔<img file="FDA00002693115800027.GIF" wi="114" he="67" />若Δt<sub>x′,y′</sub>在从Δt<sub>min</sub>到Δt<sub>max</sub>变化范围内,s(Δt<sub>x′,y′</sub>)未转为收敛状态,则认定Δt<sub>max</sub>为ω<sub>x′,y′</sub>的最优时间间隔<img file="FDA00002693115800028.GIF" wi="115" he="67" />(9)对t时刻的帧图像f<sub>t</sub>(x,y)与<img file="FDA00002693115800029.GIF" wi="149" he="67" />时刻的帧图像<img file="FDA000026931158000210.GIF" wi="241" he="72" />或<img file="FDA000026931158000211.GIF" wi="148" he="67" />时刻的帧图像<img file="FDA000026931158000212.GIF" wi="274" he="71" />的每个运动显著性区域ω<sub>x′,y′</sub>间做帧间差分,对差分结果进行连通域标记,从而得到各区域内的运动目标。
地址 210000 江苏省南京市雨花台区西春路1号6层601室