发明名称 一种多特征联合稀疏表示的目标跟踪方法
摘要 本发明通过对传统的稀疏编码跟踪器求解稀疏系数方法以及采用的目标特征进行分析和改进,提供一种多特征联合稀疏表示的目标跟踪方法,在光照影响较大、目标出现严重遮挡等复杂场景下保持目标跟踪的稳定性,提高目标跟踪器的精度。本发明包括如下步骤:构建初始字典;目标模板的分块处理;抽取候选粒子;提取目标特征;确定图像特征数和块的类别数;特征的核化处理;将候选样本用字典中所有块进行稀疏表示;核扩展;求解稀疏问题;块的残差计算;构建似然函数;更新模板库。本发明采用多特征联合描述目标,提高了算法的精度和跟踪的稳健性。
申请公布号 CN103295242A 申请公布日期 2013.09.11
申请号 CN201310241910.4 申请日期 2013.06.18
申请人 南京信息工程大学 发明人 胡昭华;吴佑林;徐玉伟;赵孝磊
分类号 G06T7/20(2006.01)I;H04N5/14(2006.01)I 主分类号 G06T7/20(2006.01)I
代理机构 南京众联专利代理有限公司 32206 代理人 顾进
主权项 1.一种基于多特征联合稀疏表示的视觉目标跟踪方法,其特征在于,包括以下步骤:(1)跟踪视频序列前n帧,将跟踪得到的前n帧目标作为初始字典;(2)按照预先设定的块的尺寸大小及分块步长,采取重叠分块的方式,对每个目标模块进行分块;重叠分块完成后,字典中的总块数=字典中目标模板的个数×每个目标模板的重叠块数;(3)跟踪过程中,对于新到来的每帧图像,抽取N个粒子,所述抽取粒子的方式如下:基于相邻帧之间目标移动很小的特点,给定一帧新的图像,在对应于上一帧跟踪目标的位置周围进行高斯采样,选取目标的运动仿射变换参数作为状态变量X<sub>t</sub>=(x<sub>t</sub>,y<sub>t</sub>,θ<sub>t</sub>,s<sub>t</sub>,α<sub>t</sub>,φ<sub>t</sub>),其中x<sub>t</sub>,y<sub>t</sub>分别表示目标在第t帧x,y方向上的坐标,θ<sub>t</sub>表示目标在第t帧的旋转角度,s<sub>t</sub>表示目标在第t帧变化的尺度,α<sub>t</sub>表示目标在第t帧的高宽比,φ<sub>t</sub>表示目标在第t帧的倾斜角;对抽取的粒子按照步骤(2)的方法进行重叠分块处理;(4)对字典中的块和候选样本中的块进行特征提取;(5)字典模板表示为:<img file="FDA00003362415800011.GIF" wi="420" he="110" />其中J为类别数,每个特征索引k=1,…,K,K为特征个数,<img file="FDA00003362415800012.GIF" wi="284" he="99" />其中m<sub>k</sub>是第k个特征的维数,p<sub>j</sub>是第j类模板的个数;<maths num="0001"><![CDATA[<math><mrow><msup><mi>X</mi><mi>k</mi></msup><mo>&Element;</mo><msup><mi>R</mi><mrow><msub><mi>m</mi><mi>k</mi></msub><mo>&times;</mo><mi>p</mi></mrow></msup></mrow></math>]]></maths>(其中<maths num="0002"><![CDATA[<math><mrow><mrow><mi>p</mi><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>J</mi></munderover><msub><mi>p</mi><mi>j</mi></msub><mo>)</mo></mrow><mo>;</mo></mrow></math>]]></maths>(6)对字典模板和候选目标进行核化处理,核化方式为X<sup>k</sup>←(X<sup>k</sup>)<sup>T</sup>X<sup>k</sup>,<img file="FDA00003362415800015.GIF" wi="332" he="96" />其中X<sup>k</sup>为字典模板,<img file="FDA00003362415800016.GIF" wi="62" he="86" />为候选样本;(7)候选样本采用与字典模板相同的特征,且其每块用字典中所有块进行多特征联合稀疏表示为:<maths num="0003"><![CDATA[<math><mrow><munder><mi>min</mi><mi>W</mi></munder><mfrac><mn>1</mn><mn>2</mn></mfrac><munderover><mi>&Sigma;</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>K</mi></munderover><msubsup><mrow><mo>|</mo><mo>|</mo><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>J</mi></munderover><mrow><mo>(</mo><msubsup><mi>y</mi><mi>j</mi><mi>k</mi></msubsup><mo>-</mo><msup><mi>X</mi><mi>k</mi></msup><msubsup><mi>w</mi><mi>j</mi><mi>k</mi></msubsup><mo>)</mo></mrow><mo>|</mo><mo>|</mo></mrow><mn>2</mn><mn>2</mn></msubsup><mo>+</mo><mi>&lambda;</mi><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>J</mi></munderover><msub><mrow><mo>|</mo><mo>|</mo><msub><mi>w</mi><mi>j</mi></msub><mo>|</mo><mo>|</mo></mrow><mn>2</mn></msub></mrow></math>]]></maths>其中<img file="FDA00003362415800018.GIF" wi="182" he="85" />表示第j类候选样本,<img file="FDA00003362415800019.GIF" wi="170" he="84" />(其中<img file="FDA000033624158000110.GIF" wi="246" he="158" />是与第j类候选样本相对应的表示系数,(8)求解上述稀疏问题得到相应的稀疏系数;(9)利用字典中与候选样本块具有相同类别的块及其表示系数进行候选样本每块的误差重构对于第j类块,重构误差计算如下:<maths num="0004"><![CDATA[<math><mrow><mi>residua</mi><msub><mi>l</mi><mi>j</mi></msub><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>K</mi></munderover><msup><mi>&theta;</mi><mi>k</mi></msup><mo>[</mo><msubsup><mi>H</mi><mi>j</mi><mi>k</mi></msubsup><mo>-</mo><mn>2</mn><msubsup><mi>h</mi><mi>j</mi><mi>k</mi></msubsup><msubsup><mover><mi>w</mi><mo>^</mo></mover><mi>j</mi><mi>k</mi></msubsup><mo>+</mo><msup><mrow><mo>(</mo><msubsup><mover><mi>w</mi><mo>^</mo></mover><mi>j</mi><mi>k</mi></msubsup><mo>)</mo></mrow><mi>T</mi></msup><msubsup><mi>G</mi><mi>j</mi><mi>k</mi></msubsup><msubsup><mover><mi>w</mi><mo>^</mo></mover><mi>j</mi><mi>k</mi></msubsup><mo>]</mo></mrow></math>]]></maths>其中<maths num="0005"><![CDATA[<math><mrow><msubsup><mi>G</mi><mi>j</mi><mi>k</mi></msubsup><mo>=</mo><msup><mi>&phi;</mi><mi>k</mi></msup><msup><mrow><mo>(</mo><msubsup><mi>X</mi><mi>j</mi><mi>k</mi></msubsup><mo>)</mo></mrow><mi>T</mi></msup><msup><mi>&phi;</mi><mi>k</mi></msup><mrow><mo>(</mo><msubsup><mi>X</mi><mi>j</mi><mi>k</mi></msubsup><mo>)</mo></mrow><mo>,</mo><msubsup><mi>H</mi><mi>j</mi><mi>k</mi></msubsup><mo>=</mo><msup><mi>&phi;</mi><mi>k</mi></msup><msup><mrow><mo>(</mo><msubsup><mi>y</mi><mi>j</mi><mi>k</mi></msubsup><mo>)</mo></mrow><mi>T</mi></msup><msup><mi>&phi;</mi><mi>k</mi></msup><mrow><mo>(</mo><msubsup><mi>y</mi><mi>j</mi><mi>k</mi></msubsup><mo>)</mo></mrow><mo>,</mo><msubsup><mrow><mo>{</mo><msup><mi>&theta;</mi><mi>k</mi></msup><mo>}</mo></mrow><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>K</mi></msubsup><mrow><mo>(</mo><msub><mi>&Sigma;</mi><mi>k</mi></msub><msup><mi>&theta;</mi><mi>k</mi></msup><mo>=</mo><mn>1</mn><mo>)</mo></mrow></mrow></math>]]></maths>是核权值,用以度量不同特征在最后决策上的置信度大小;(10)将步骤(9)求得的候选样本的每个块的残差residual<sub>j</sub>进行累加,<img file="FDA00003362415800023.GIF" wi="509" he="154" />再对所有候选样本按照residual进行排序,最小residual对应的候选样本即为最佳样本;(11)联合稀疏表示和子空间学习来实现对字典模板的更新。
地址 210019 江苏省南京市奥体大街69号