发明名称 基于多特征融合与增量学的多摄像机间的目标匹配方法
摘要 本发明公开了一种基于多特征融合与增量学的多摄像机间的目标匹配方法。本发明中的目标的特征模型是指提取目标的SIFT特征,将该特征量化到已创建好的分层词汇树上,形成分层词汇树直方图特征,提取颜色直方图特征,根据两种直方图特征得到初步融合特征,对融合特征实施核PCA降维,提取出非线性融合特征。目标的分类识别是将多目标非线性融合特征送入多类SVM分类器中进行分类识别。目标模型的在线更新是通过对多类SVM分类器增量学完成的,当摄像机视野域内出现新目标以及目标的外观形态发生较大变化时,目标模型通过增量SVM学不断被更新。本发明融合了目标的词汇树直方图特征和颜色直方图特征,显著提高了目标的识别率。
申请公布号 CN103336971A 申请公布日期 2013.10.02
申请号 CN201310284015.0 申请日期 2013.07.08
申请人 浙江工商大学 发明人 王慧燕;郑佳
分类号 G06K9/62(2006.01)I;G06K9/46(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 杭州求是专利事务所有限公司 33200 代理人 杜军
主权项 1. 基于多特征融合与增量学习的多摄像机间的目标匹配方法,其特征在于该方法包括以下步骤:步骤(1)构建分层词汇树直方图特征:为了得到目标的分层词汇树特征,首先需要建立一个分层词汇树,然后将目标的SIFT特征量化到词汇树上形成词汇树特征,具体步骤为:(a)首先对训练图像特征进行<i>K</i>均值聚类,从而将特征集划分成<i>K</i>个分支,然后对每一个分支递归地执行<i>K</i>均值聚类从而得到下一层<i>K</i>个更细的分支,通过层层递归直到最大的层数<i>L</i>,最终创建成一个词汇树; 整个词汇树的节点数<i>M</i>,即视觉单词数为:<img file="2013102840150100001DEST_PATH_IMAGE002.GIF" wi="195" he="58" />(1) 其中i表示词汇树的第i层(b)当词汇树创建好后,由于不同的树节点对于整个被量化的特征集而言有不同的重要性,为每一个节点分配一个权重<img file="2013102840150100001DEST_PATH_IMAGE004.GIF" wi="18" he="25" /><img file="2013102840150100001DEST_PATH_IMAGE006.GIF" wi="98" he="55" />(2)其中<i>N</i>是模型中图像的个数,<img file="2013102840150100001DEST_PATH_IMAGE008.GIF" wi="22" he="25" />是至少有一个图像的描述算子特征矢量经过节点<i>i</i>的图像个数;(c)为了获得每一个目标图像的词汇树直方图,128维的SIFT特征矢量将使用词汇树中的视觉词汇来量化;当一个目标图像的SIFT特征被提取后,它们只需从上而下在每一层逐个与<i>K</i>个候选的聚类中心做比较,从而选择距离最近的聚类中心;对于一个被给定的目标<i>O</i>,在<i>t</i>时刻它的词汇树直方图特征<img file="2013102840150100001DEST_PATH_IMAGE010.GIF" wi="21" he="26" />被表示为:<img file="2013102840150100001DEST_PATH_IMAGE012.GIF" wi="302" he="33" />(3)其中<i>M</i>是整个词汇树中的视觉单词个数,即节点个数,由公式(1)计算出来;<img file="2013102840150100001DEST_PATH_IMAGE014.GIF" wi="25" he="30" />为加权的单词直方图;<img file="2013102840150100001DEST_PATH_IMAGE016.GIF" wi="96" he="31" />(4)其中<img file="2013102840150100001DEST_PATH_IMAGE018.GIF" wi="20" he="30" />是路径节点<i>i</i>的SIFT描述算子特征矢量的个数,<img file="2013102840150100001DEST_PATH_IMAGE020.GIF" wi="24" he="30" />由公式(2)计算得到;步骤(2)构建颜色直方图特征:由于 HSV空间更加接近于人们对颜色的主观认识,在目标图像的HSV空间上提取目标的颜色直方图特征;对于被给定的目标<i>O</i>,它在<i>t</i>时刻的HSV颜色直方图特征<img file="2013102840150100001DEST_PATH_IMAGE022.GIF" wi="22" he="26" />可以表示为:<img file="2013102840150100001DEST_PATH_IMAGE024.GIF" wi="172" he="36" />(5)其中<img file="2013102840150100001DEST_PATH_IMAGE026.GIF" wi="25" he="30" />表示HSV每一级别的值;步骤(3)特征融合:首先使用简单连续特征融合策略将词汇树直方图特征与颜色直方图特征结合;然后使用核PCA算法从融合的<img file="2013102840150100001DEST_PATH_IMAGE028.GIF" wi="14" he="24" />特征集中提取出非线性特征,从而将融合的特征集降到一定的维数;具体步骤为:(a)对于一个被给定的目标<i>O</i>,它在<i>t</i>时刻利用连续特征融合策略获得的融合特征向量<img file="2013102840150100001DEST_PATH_IMAGE030.GIF" wi="22" he="26" />表示为:<img file="2013102840150100001DEST_PATH_IMAGE032.GIF" wi="93" he="26" />(6)(b)将特征向量<img file="824239DEST_PATH_IMAGE030.GIF" wi="22" he="26" />映射到一个高维的特征空间<img file="2013102840150100001DEST_PATH_IMAGE034.GIF" wi="48" he="26" />,然后在<img file="302625DEST_PATH_IMAGE034.GIF" wi="48" he="26" />上实施PCA算法,从而获得最终的非线性特征<img file="2013102840150100001DEST_PATH_IMAGE036.GIF" wi="22" he="26" />;在特征映射到高维空间过程中,使用了高斯核函数;步骤 (4)分类识别:将最终目标视频帧的融合非线性特征送入多类SVM中进行训练学习,当目标从一个摄像机视野域内进入另外一个摄像机视野域时,利用多类SVM对目标进行分类识别,并标注对应的目标标签,以供交接摄像机对各目标进行准确的跟踪;步骤 (5) 目标模型在线更新:当摄像机视野域内出现新目标以及目标的外观形态发生较大变化时,目标模型通过增量SVM学习被更新;该增量SVM的基本思想是将之前视频帧的所有目标训练样本在保持KKT条件下,扰动新的训练样本;该增量SVM学习方法首先参与修改SVM的核函数,然后增量更正之前的结果直到KKT条件满足新的核函数的设置;每一次增量的扰动,将会造成至少一个样本的类别改变,因此当新的样本和增量前的样本都满足KKT条件时,所有的训练样本最终会被分成三个类别,即间隔支持向量,错误支持向量和保留向量;当模型更新后,使用新的目标特征模型,返回步骤(4),利用更新后的特征模型进行分类识别。
地址 310018 浙江省杭州市下沙高教园区学正街18号