发明名称 一种单目标跟踪方法及其实现装置
摘要 一种单目标跟踪方法及其实现装置,包括:在N帧灰度图像组成的视频V={F<sub>0</sub>,F<sub>1</sub>,F<sub>N</sub>}中,在F<sub>0</sub>帧中选定目标O<sub>0</sub>,对图像O<sub>0</sub>进行灰度化处理和宽高归一化处理,得到该图像的初始化参数;分类器初始化及其更新,包括训练集的构造、特征提取和模型更新三部分;跟踪目标,利用模型f<sub>t+1</sub>在F<sub>t+1</sub>帧图像进行目标跟踪。本发明基于二值特征的压缩感知降维方法来表达目标的表观,能够有效表达目标的形变,提高抗遮挡以及光照的能力,从而能够鲁棒跟踪目标,同时具有内存消耗低和计算量小的优势,达到实时跟踪速度。
申请公布号 CN103310466B 申请公布日期 2016.02.17
申请号 CN201310268834.6 申请日期 2013.06.28
申请人 安科智慧城市技术(中国)有限公司 发明人 王军;陈先开;吴金勇
分类号 G06T7/20(2006.01)I;G06K9/62(2006.01)I 主分类号 G06T7/20(2006.01)I
代理机构 深圳市凯达知识产权事务所 44256 代理人 任转英;刘大弯
主权项 一种单目标跟踪方法,包括:第一步,初始化参数,即,在F<sub>0</sub>帧中获取目标O<sub>0</sub>初始位置的矩形框B<sub>0</sub>=[x<sub>0</sub>,y<sub>0</sub>,w<sub>0</sub>,h<sub>0</sub>],分别表示边框的左上角横坐标,左上角纵坐标,边框宽,边框高;在宽高相同的图像块I上,生成L个随机点对集<img file="FDA0000825972750000011.GIF" wi="551" he="111" />其中<img file="FDA0000825972750000012.GIF" wi="261" he="70" />分别表示第l个点对之第一个点的横坐标,第一个点的纵坐标,第二点的横坐标,第二个点的纵坐标,随机点对的生成方式限制在水平或垂直两种;生成稀疏随机矩阵A,用于特征降维;第二步,分类器初始化及其更新,进行第t(t=0,1,…,N‑1)次迭代更新,将处理第t帧图像F<sub>t</sub>,包括训练样本集D<sub>t</sub>构造、特征提取和模型更新三个处理过程;其中,所述特征提取为提取所述训练样本集D<sub>t</sub>中的所有样本图像{I<sub>i</sub>,y<sub>i</sub>}的特征,具体步骤如下:a)初始化样本图像{I<sub>i</sub>,y<sub>i</sub>}的特征为<img file="FDA0000825972750000013.GIF" wi="325" he="150" />特征长度为L;b)<img file="FDA0000825972750000014.GIF" wi="36" he="71" />的第j∈{1,2,…,L}个分量值<img file="FDA0000825972750000015.GIF" wi="53" he="79" />的计算公式如下:<img file="FDA0000825972750000016.GIF" wi="790" he="175" />其中,I<sub>i</sub>表示样本图像;y<sub>i</sub>∈{‑1,1}表示样本的类别标签,‑1表示负样本,1表示正样本;I<sub>i</sub>(p,q)表示图像I<sub>i</sub>在点(p,q)的灰度像素值;c)利用稀疏随机矩阵A对<img file="FDA0000825972750000017.GIF" wi="39" he="78" />进行降维,维数为50‑300,从而得到新的特征z,计算公式如下:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>z</mi><mo>=</mo><mi>A</mi><mover><mi>z</mi><mo>&OverBar;</mo></mover></mrow>]]></math><img file="FDA0000825972750000018.GIF" wi="150" he="78" /></maths>得到训练样本集D<sub>t</sub>的特征集<img file="FDA0000825972750000019.GIF" wi="366" he="94" />第三步,目标跟踪,利用模型f<sub>t+1</sub>在F<sub>t+1</sub>帧图像进行目标跟踪,跟踪步骤包括:预测样本构造,特征提取,样本分类,选择置信度最高的多数个样本,生成一个最终的目标边界框,输出跟踪框,t=t+1,若t>N‑1,则结束跟踪;否则,返回第二步。
地址 518034 广东省深圳市福田区深南大道特区报业大厦1306房