发明名称 基于L0正则化的局部稀疏表示目标跟踪方法
摘要 本发明公开了一种基于L0正则化的局部稀疏表示目标跟踪方法,与传统L1目标跟踪方法不同,本发明提出将L0范数与结构化局部稀疏外观模型相结合,充分利用稀疏编码,更好地区别跟踪过程中的目标和背景,并且在对目标进行建模时使用琐碎模板对局部遮挡等干扰进行建模,进一步提高了算法在跟踪过程中对噪声干扰的鲁棒性。为使目标模型在跟踪过程中更好地应对目标外观的不断变化,本发明通过构建目标模板集,在跟踪过程中采用L0范数对目标重构并采用概率性策略将重构结果替换模板集中某一模板,实现模板动态更新,进一步提高了算法稳定性。针对基于L0范数约束的目标函数优化求解的NP问题,本发明采用APG算法实现了有效求解。
申请公布号 CN105931273A 申请公布日期 2016.09.07
申请号 CN201610299342.7 申请日期 2016.05.04
申请人 江南大学 发明人 蒋敏;沈剑宇;孔军;陈志义;黄顺所;柳晨华;成静
分类号 G06T7/20(2006.01)I 主分类号 G06T7/20(2006.01)I
代理机构 代理人
主权项 基于L0正则化的局部稀疏表示目标跟踪方法,其特征在于,包括下列步骤:步骤一、读入第一帧图像Image<sub>1</sub>及跟踪目标初始矩形位置;步骤二、根据第一帧的位置,在粒子滤波框架下采用最近邻算法获得前m帧的目标矩形位置,每帧目标矩形区域构成一个模板T<sub>i</sub>,前m帧的目标矩形位置构成模板集T=[T<sub>1</sub>,T<sub>2</sub>,…,T<sub>m</sub>];步骤三、对于每个模板T<sub>i</sub>,设T<sub>i</sub>的大小为W×H,在T<sub>i</sub>中按照采样距离为<img file="FDA0000981052320000011.GIF" wi="49" he="102" />重叠采样N个局部图像块,每个采样的图像块大小为<img file="FDA0000981052320000012.GIF" wi="167" he="102" />这些模板中的局部图像块拼接起来并组成一个字典D=[p<sub>1</sub>,p<sub>2</sub>,……p<sub>(m×N)</sub>]∈R<sup>d×m×N</sup>,其中d为局部图像块p<sub>i</sub>向量化表示后的向量维数,m为模板的数量,N为每个模板中重叠采样的局部图像块的个数;步骤四、读入下一帧图像Image<sub>t</sub>(t&gt;m),在前一帧的目标位置处采用粒子滤波框架下随机游走的方式采样得到k个候选样本[Y<sub>1</sub>,Y<sub>2</sub>,…,Y<sub>k</sub>];步骤五、对每一个候选样本Y<sub>v∈[1k]</sub>,重叠采样N个局部图像块,并用Y<sub>v</sub>=[y<sub>1</sub>,y<sub>2</sub>,…,y<sub>N</sub>]∈R<sup>d×N</sup>表示,其中d为局部图像块向量化表示后的向量维数,N为局部图像块数,对每一个候选样本Y<sub>v</sub>的局部图像块y<sub>i</sub>(i=1,2,…N)构建目标函数,并对重构样本与观测样本图像块的残差e<sub>i</sub>∈R<sup>d×1</sup>进行拉普拉斯建模||e<sub>i</sub>||<sub>1</sub>,建立琐碎模板,以容纳目标跟踪中受到的离群子干扰;针对目标系数<img file="FDA0000981052320000013.GIF" wi="323" he="89" /><img file="FDA0000981052320000018.GIF" wi="235" he="64" />利用L0范数正则化目标系数||c<sub>i</sub>||<sub>0</sub>,以在重构样本时,更好的消除冗余特征的干扰,提出了本方法的目标函数:<img file="FDA0000981052320000016.GIF" wi="895" he="79" /><img file="FDA0000981052320000017.GIF" wi="193" he="62" />其中,y<sub>i</sub>为候选样本Y<sub>v</sub>的局部图像块,D为由m个模板局部重叠采样组成的字典,e<sub>i</sub>为噪声,初始化时为e<sub>i</sub>∈R<sup>d×1</sup>的零向量;步骤六、基于迭代加速近邻梯度算法(APG算法),对目标函数进行最小化计算,获得收敛的残差<img file="FDA0000981052320000014.GIF" wi="51" he="67" />和<img file="FDA0000981052320000015.GIF" wi="72" he="65" />对所有N个局部图像块y<sub>i</sub>∈Y<sub>v</sub>进行同样处理,最终获得最优目标系数<img file="FDA0000981052320000021.GIF" wi="439" he="70" />其中<img file="FDA0000981052320000022.GIF" wi="371" he="75" />步骤七、向量<img file="FDA0000981052320000028.GIF" wi="49" he="67" />描述了Y<sub>v</sub>的局部图像块y<sub>i</sub>在字典D=[p<sub>1</sub>,p<sub>2</sub>,……p<sub>(m×N)</sub>]∈R<sup>d×m×N</sup>中的稀疏编码方式,字典D由m个模板分别抽取的N个局部图像块共同构成;因此根据模板数量,将<img file="FDA0000981052320000029.GIF" wi="51" he="68" />划分m成段,得到<img file="FDA0000981052320000023.GIF" wi="659" he="106" />其中<img file="FDA0000981052320000027.GIF" wi="271" he="83" />表示目标候选图像Y<sub>v</sub>中第i个局部图像块的稀疏编码系数向量<img file="FDA0000981052320000024.GIF" wi="51" he="69" />中与第j个模板相对应的那段,并对每一段进行加权求和得到更加鲁棒的稀疏向量z<sub>i</sub>,<img file="FDA0000981052320000026.GIF" wi="371" he="107" />z<sub>i</sub>∈R<sup>N×1</sup>表示第i个局部图像块的加权编码,γ为归一化项,对Y<sub>v</sub>的N个局部图像块进行同样的处理,最终获得加权编码方阵Z=[z<sub>1</sub>,z<sub>2</sub>,…z<sub>N</sub>],Z∈R<sup>N×N</sup>;步骤八、通过对每一个候选样本Y<sub>v</sub>∈R<sup>d×N</sup>的加权编码矩阵Z的对角线元素求和,取加权编码矩阵Z的对角线元素和最大的候选样本作为第t帧的跟踪结果<img file="FDA0000981052320000025.GIF" wi="80" he="65" />步骤九、基于最新跟踪结果,采用PCA主元重构样本,采用概率策略选择更新模板集T中的某个模板;步骤十、若视频未结束,则转入步骤四,读入下一帧图像;否则跟踪结束。
地址 214122 江苏省无锡市滨湖区蠡湖大道1800号