发明名称 一种基于图像集的目标跟踪算法
摘要 本发明公开了一种基于图像集的目标跟踪算法,包括初始化阶段,用于建立目标模型的训练阶段,用于根据所建立的目标模型测试出指定目标物体的中心位置的测试阶段,和更新阶段。本发明采用图像集作为目标跟踪过程中训练样本和测试样本的基本单位,并在核偏最小二乘法的框架下,将目标跟踪问题视为一个多类别的分类问题,从而能够有效缓解跟踪器的“漂移”问题。
申请公布号 CN104008397B 申请公布日期 2017.05.03
申请号 CN201410251910.7 申请日期 2014.06.09
申请人 华侨大学 发明人 钟必能;陈雁;王田;谢维波;陈锻生;陈维斌
分类号 G06K9/62(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 厦门市首创君合专利事务所有限公司 35204 代理人 张松亭
主权项 一种基于图像集的目标跟踪算法,其特征在于,包括初始化阶段,用于建立目标模型的训练阶段,用于根据所建立的目标模型测试出指定目标物体的中心位置的测试阶段,和更新阶段;所述初始化阶段包括:提取一帧图像,人为指定该图像中的目标物体和多个非目标物体,并人为获取一个正例类别图像集和多个负例类别图像集;所述正例类别图像集为从当前一帧图像中提取的多个包含所述人为指定该图像中的目标物体的图像块所构成的集合,其中所有图像块均标记为静态图像块;其中一个负例类别图像集为从当前一帧图像中提取的多个包含其中一个指定的非目标物体的图像块所构成的集合;不同的负例类别图像集中的图像块所包含的非目标物体不同;所提取的所有图像块大小均一致;将所指定的目标物体的中心位置设为当前位置;然后转入训练阶段;所述训练阶段包括:A1、将当前所获取的正例类别图像集构造成一个样本矩阵,并将该样本矩阵的类别标记为目标类;分别将当前所获取的每个负例类别图像集均构造成一个样本矩阵,并将这些样本矩阵的类别依次标记为第1非目标类、第2非目标类、…;当前所获取的正例类别图像集所生成的样本矩阵为该正例类别图像集中所有图像块的d维特征向量的协方差矩阵,其中d属于正整数;当前其中一个负例类别图像集所生成的样本矩阵为该负例类别图像集中所有图像块的d维特征向量的协方差矩阵;A2、建立一个训练集合,该训练集合由当前所获取的所有样本矩阵构成;设定该训练集合中的样本矩阵个数为m个,其中m属于正整数,并将该训练集合中的样本矩阵分别记为C<sub>1</sub>,C<sub>2</sub>,…,C<sub>m</sub>,其中C<sub>i</sub>∈R<sup>d×d</sup>(i=1,2,…m);将该训练集合中的每个样本矩阵均转换为一个样本列向量,得到m个样本列向量分别为x<sub>1</sub>,x<sub>2</sub>,…,x<sub>m</sub>,分别对应C<sub>1</sub>,C<sub>2</sub>,…,C<sub>m</sub>;其中,<img file="FDA0001171814860000011.GIF" wi="454" he="77" />由C<sub>i</sub>的矩阵元素从上到下从左到右串起来而生成;然后设定C<sub>1</sub>和C<sub>2</sub>的黎曼核函数分别为<img file="FDA0001171814860000012.GIF" wi="109" he="55" />和<img file="FDA0001171814860000013.GIF" wi="140" he="55" />得出<img file="FDA0001171814860000014.GIF" wi="110" he="56" />和<img file="FDA0001171814860000015.GIF" wi="115" he="55" />之间满足<img file="FDA0001171814860000016.GIF" wi="1302" he="69" />A3、分别将C<sub>1</sub>,C<sub>2</sub>,…,C<sub>m</sub>的各类别用列向量形式表示,得到m个类别列向量分别为y<sub>1</sub>,y<sub>2</sub>,…,y<sub>m</sub>,分别对应C<sub>1</sub>,C<sub>2</sub>,…,C<sub>m</sub>,并分别对应x<sub>1</sub>,x<sub>2</sub>,…,x<sub>m</sub>;其中,y<sub>i</sub>=[0,0,...,1,...,0]<sup>T</sup>(i=1,2,…m),是除了第k(k=1,2,…m)个元素为1之外,其余全为0的向量;当k=1时,其含义表示C<sub>i</sub>或x<sub>i</sub>属于目标类;当1&lt;k≤m时,其含义表示C<sub>i</sub>或x<sub>i</sub>属于第k‑1非目标类;然后设定X=[x<sub>1</sub>,x<sub>2</sub>,...,x<sub>m</sub>]<sup>T</sup>,并设定Y=[y<sub>1</sub>,y<sub>2</sub>,...,y<sub>m</sub>]<sup>T</sup>作为X的类别矩阵;之后根据偏最小二乘回归,将X和Y分解成:<maths num="0001"><math><![CDATA[<mrow><mtable><mtr><mtd><mrow><mi>X</mi><mo>=</mo><msup><mi>TP</mi><mi>T</mi></msup><mo>+</mo><mi>E</mi></mrow></mtd></mtr><mtr><mtd><mrow><mi>Y</mi><mo>=</mo><msup><mi>UQ</mi><mi>T</mi></msup><mo>+</mo><mi>F</mi></mrow></mtd></mtr></mtable><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0001171814860000021.GIF" wi="942" he="143" /></maths>其中,T和U都是m×p的矩阵,包含了p个隐藏向量,P为d<sup>2</sup>×p的矩阵,Q为m×p的矩阵,E和F为残差矩阵;A4、基于非线性迭代的偏最小二乘回归,计算出X和Y之间的回归系数为:B=X<sup>T</sup>U(T<sup>T</sup>XX<sup>T</sup>U)<sup>‑1</sup>T<sup>T</sup>Y            (3)设定一个黎曼核矩阵<img file="FDA0001171814860000022.GIF" wi="575" he="64" />并设定M=φφ<sup>T</sup>;将φ代入式(3)中的X,得出φ和Y之间的回归系数为:B<sub>φ</sub>=φ<sup>T</sup>U(T<sup>T</sup>MU)<sup>‑1</sup>T<sup>T</sup>Y            (4)然后基于B<sub>φ</sub>建立所述目标模型为:<maths num="0002"><math><![CDATA[<mrow><msubsup><mi>y</mi><mi>t</mi><mi>T</mi></msubsup><mo>=</mo><msup><mrow><mo>&lsqb;</mo><mi>&phi;</mi><mrow><mo>(</mo><msub><mi>c</mi><mi>t</mi></msub><mo>)</mo></mrow><mo>&rsqb;</mo></mrow><mi>T</mi></msup><msub><mi>B</mi><mi>&phi;</mi></msub><mo>=</mo><msubsup><mi>M</mi><mi>t</mi><mi>T</mi></msubsup><mi>U</mi><msup><mrow><mo>(</mo><msup><mi>T</mi><mi>T</mi></msup><mi>M</mi><mi>U</mi><mo>)</mo></mrow><mrow><mo>-</mo><mn>1</mn></mrow></msup><msup><mi>T</mi><mi>T</mi></msup><mi>Y</mi><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>5</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0001171814860000023.GIF" wi="1198" he="77" /></maths>其中<img file="FDA0001171814860000024.GIF" wi="152" he="71" />是一个需要预测类别的样本列向量,该样本列向量是由一个需要预测类别的样本矩阵的矩阵元素从上到下从左到右串起来而得到,而该样本矩阵是一个需要预测类别的图像集中所有图像块的d维特征向量的协方差矩阵;M<sub>t</sub>是M中的一个元素;y<sub>t</sub>=[β,γ<sub>1</sub>,γ<sub>2</sub>,...,γ<sub>m‑1</sub>]<sup>T</sup>为根据所述目标模型计算得出的c<sub>t</sub>的类别列向量;其中,β表示c<sub>t</sub>属于目标类的概率,γ<sub>i</sub>(i=1,...,m‑1)表示c<sub>t</sub>属于第i非目标类的概率;然后转入测试阶段;所述测试阶段包括:B1、提取下一帧图像,设定该图像上以所述当前位置为中心、以指定半径长度为半径的圆形区域为该图像的搜索区域;转入步骤B2;B2、在当前一帧图像的搜索区域中选取至少一个位置,作为当前一帧图像的测试位置;对于当前一帧图像的每个测试位置,在距离该测试位置小于一个预设值的周围选取多个位置,作为该测试位置的周围位置,分别以该测试位置及其周围位置为中心提取图像块,作为该测试位置的测试图像块,并将这些测试图像块构成一个集合,作为该测试位置的测试图像集;所述测试图像集中的所有测试图像块大小均一致,且与所述初始化阶段中正例类别图像集或负例类别图像集内的图像块大小一致;转入步骤B3;B3、分别将当前所获取的每个测试图像集均构造成一个样本矩阵,其中一个测试图像集所生成的样本矩阵为该测试图像集中所有测试图像块的d维特征向量的协方差矩阵;分别将所获取的每个测试图像集的样本矩阵均转换为一个样本列向量,其中一个测试图像集的样本列向量由该测试图像集的样本矩阵的矩阵元素从上到下从左到右串起来而生成;然后分别将这些样本列向量代入当前所建立的目标模型中,得到其类别列向量;转入步骤B4;B4、选取这些类别列向量中与所述目标类样本矩阵的类别列向量最接近的一个,若该类别列向量与所述目标类样本矩阵的类别列向量的差值大于预设的阈值,则舍弃当前所获取的所有测试图像集,并转入步骤B2;若该类别列向量与所述目标类样本矩阵的类别列向量的差值小于或等于预设的阈值,则转入更新阶段;所述更新阶段包括:C1、将所述当前位置更新为所选取的类别列向量所对应的测试图像集的测试位置,并记录跟踪;若当前所述正例类别图像集中的所有图像块均为静态图像块,则将该测试图像集中的所有图像块均添加入所述正例类别图像集中;若当前所述正例类别图像集中不只包含所述静态图像块,则将所述正例类别图像集中所有非静态图像块依次替换为该测试图像集中的图像块;C2、排除所述当前位置,在当前一帧图像的搜索区域中随机选取多个位置,作为当前一帧图像的非目标物体位置;针对当前一帧图像的每个非目标物体位置,在距离该非目标物体位置小于所述预设值的周围选取多个位置,作为该非目标物体位置的周围位置,分别以该非目标物体位置及其周围位置为中心提取图像块,然后将这些图像块构成一个负例类别图像集,其中,这些图像块的大小均与所述初始化阶段中正例类别图像集或负例类别图像集的图像块大小一致;将上一帧图像的负例类别图像集依次替换为当前一帧图像所产生的负例类别图像集;转入训练阶段。
地址 362000 福建省泉州市丰泽区城东