主权项 |
1.一种基于多特征联合稀疏表示的视觉目标跟踪方法,其特征在于,包括以下步骤:(1)跟踪视频序列前n帧,将跟踪得到的前n帧目标作为初始字典;(2)按照预先设定的块的尺寸大小及分块步长,采取重叠分块的方式,对每个目标模块进行分块;重叠分块完成后,字典中的总块数=字典中目标模板的个数×每个目标模板的重叠块数;(3)跟踪过程中,对于新到来的每帧图像,抽取N个粒子,所述抽取粒子的方式如下:基于相邻帧之间目标移动很小的特点,给定一帧新的图像,在对应于上一帧跟踪目标的位置周围进行高斯采样,选取目标的运动仿射变换参数作为状态变量X<sub>t</sub>=(x<sub>t</sub>,y<sub>t</sub>,θ<sub>t</sub>,s<sub>t</sub>,α<sub>t</sub>,φ<sub>t</sub>),其中x<sub>t</sub>,y<sub>t</sub>分别表示目标在第t帧x,y方向上的坐标,θ<sub>t</sub>表示目标在第t帧的旋转角度,s<sub>t</sub>表示目标在第t帧变化的尺度,α<sub>t</sub>表示目标在第t帧的高宽比,φ<sub>t</sub>表示目标在第t帧的倾斜角;对抽取的粒子按照步骤(2)的方法进行重叠分块处理;(4)对字典中的块和候选样本中的块进行特征提取;(5)字典模板表示为:<img file="FDA00003362415800011.GIF" wi="420" he="110" />其中J为类别数,每个特征索引k=1,…,K,K为特征个数,<img file="FDA00003362415800012.GIF" wi="284" he="99" />其中m<sub>k</sub>是第k个特征的维数,p<sub>j</sub>是第j类模板的个数;<maths num="0001"><![CDATA[<math><mrow><msup><mi>X</mi><mi>k</mi></msup><mo>∈</mo><msup><mi>R</mi><mrow><msub><mi>m</mi><mi>k</mi></msub><mo>×</mo><mi>p</mi></mrow></msup></mrow></math>]]></maths>(其中<maths num="0002"><![CDATA[<math><mrow><mrow><mi>p</mi><mo>=</mo><munderover><mi>Σ</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>J</mi></munderover><msub><mi>p</mi><mi>j</mi></msub><mo>)</mo></mrow><mo>;</mo></mrow></math>]]></maths>(6)对字典模板和候选目标进行核化处理,核化方式为X<sup>k</sup>←(X<sup>k</sup>)<sup>T</sup>X<sup>k</sup>,<img file="FDA00003362415800015.GIF" wi="332" he="96" />其中X<sup>k</sup>为字典模板,<img file="FDA00003362415800016.GIF" wi="62" he="86" />为候选样本;(7)候选样本采用与字典模板相同的特征,且其每块用字典中所有块进行多特征联合稀疏表示为:<maths num="0003"><![CDATA[<math><mrow><munder><mi>min</mi><mi>W</mi></munder><mfrac><mn>1</mn><mn>2</mn></mfrac><munderover><mi>Σ</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>K</mi></munderover><msubsup><mrow><mo>|</mo><mo>|</mo><munderover><mi>Σ</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>J</mi></munderover><mrow><mo>(</mo><msubsup><mi>y</mi><mi>j</mi><mi>k</mi></msubsup><mo>-</mo><msup><mi>X</mi><mi>k</mi></msup><msubsup><mi>w</mi><mi>j</mi><mi>k</mi></msubsup><mo>)</mo></mrow><mo>|</mo><mo>|</mo></mrow><mn>2</mn><mn>2</mn></msubsup><mo>+</mo><mi>λ</mi><munderover><mi>Σ</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>J</mi></munderover><msub><mrow><mo>|</mo><mo>|</mo><msub><mi>w</mi><mi>j</mi></msub><mo>|</mo><mo>|</mo></mrow><mn>2</mn></msub></mrow></math>]]></maths>其中<img file="FDA00003362415800018.GIF" wi="182" he="85" />表示第j类候选样本,<img file="FDA00003362415800019.GIF" wi="170" he="84" />(其中<img file="FDA000033624158000110.GIF" wi="246" he="158" />是与第j类候选样本相对应的表示系数,(8)求解上述稀疏问题得到相应的稀疏系数;(9)利用字典中与候选样本块具有相同类别的块及其表示系数进行候选样本每块的误差重构对于第j类块,重构误差计算如下:<maths num="0004"><![CDATA[<math><mrow><mi>residua</mi><msub><mi>l</mi><mi>j</mi></msub><mo>=</mo><munderover><mi>Σ</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>K</mi></munderover><msup><mi>θ</mi><mi>k</mi></msup><mo>[</mo><msubsup><mi>H</mi><mi>j</mi><mi>k</mi></msubsup><mo>-</mo><mn>2</mn><msubsup><mi>h</mi><mi>j</mi><mi>k</mi></msubsup><msubsup><mover><mi>w</mi><mo>^</mo></mover><mi>j</mi><mi>k</mi></msubsup><mo>+</mo><msup><mrow><mo>(</mo><msubsup><mover><mi>w</mi><mo>^</mo></mover><mi>j</mi><mi>k</mi></msubsup><mo>)</mo></mrow><mi>T</mi></msup><msubsup><mi>G</mi><mi>j</mi><mi>k</mi></msubsup><msubsup><mover><mi>w</mi><mo>^</mo></mover><mi>j</mi><mi>k</mi></msubsup><mo>]</mo></mrow></math>]]></maths>其中<maths num="0005"><![CDATA[<math><mrow><msubsup><mi>G</mi><mi>j</mi><mi>k</mi></msubsup><mo>=</mo><msup><mi>φ</mi><mi>k</mi></msup><msup><mrow><mo>(</mo><msubsup><mi>X</mi><mi>j</mi><mi>k</mi></msubsup><mo>)</mo></mrow><mi>T</mi></msup><msup><mi>φ</mi><mi>k</mi></msup><mrow><mo>(</mo><msubsup><mi>X</mi><mi>j</mi><mi>k</mi></msubsup><mo>)</mo></mrow><mo>,</mo><msubsup><mi>H</mi><mi>j</mi><mi>k</mi></msubsup><mo>=</mo><msup><mi>φ</mi><mi>k</mi></msup><msup><mrow><mo>(</mo><msubsup><mi>y</mi><mi>j</mi><mi>k</mi></msubsup><mo>)</mo></mrow><mi>T</mi></msup><msup><mi>φ</mi><mi>k</mi></msup><mrow><mo>(</mo><msubsup><mi>y</mi><mi>j</mi><mi>k</mi></msubsup><mo>)</mo></mrow><mo>,</mo><msubsup><mrow><mo>{</mo><msup><mi>θ</mi><mi>k</mi></msup><mo>}</mo></mrow><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>K</mi></msubsup><mrow><mo>(</mo><msub><mi>Σ</mi><mi>k</mi></msub><msup><mi>θ</mi><mi>k</mi></msup><mo>=</mo><mn>1</mn><mo>)</mo></mrow></mrow></math>]]></maths>是核权值,用以度量不同特征在最后决策上的置信度大小;(10)将步骤(9)求得的候选样本的每个块的残差residual<sub>j</sub>进行累加,<img file="FDA00003362415800023.GIF" wi="509" he="154" />再对所有候选样本按照residual进行排序,最小residual对应的候选样本即为最佳样本;(11)联合稀疏表示和子空间学习来实现对字典模板的更新。 |