发明名称 基于图论聚类和色彩不变空间的目标跟踪方法
摘要 基于图论聚类和色彩不变空间的目标跟踪方法,包括以下步骤:1)对视频流的图像进行色彩不变空间转换,用色彩不变特征CSIFT特征提取特征点;2)特征的图论运动聚类,具有相同运动趋势的特征点属于相同运动状态的目标,由特征点跟踪到视频帧中的目标。本发明采用局部不变特征,摒弃全局特征的盲目性;实现色彩不变特征CSIFT提取,在保持SIFT特征几何不变性优势的同时增加了色彩不变性,从灰度特征空间提升为彩色空间;针对静止背景下的运动物体,将图论思想融入匹配,将特征运动分类作为匹配的预处理,使匹配操作更加准确、快速。
申请公布号 CN102236901B 申请公布日期 2013.06.05
申请号 CN201110181318.0 申请日期 2011.06.30
申请人 南京大学 发明人 李勃;陈抒瑢;董蓉;翟霄宇;顾昊;丁文;杨娴;陈启美;郁建桥;徐亮
分类号 G06T7/20(2006.01)I;G06K9/62(2006.01)I 主分类号 G06T7/20(2006.01)I
代理机构 南京天翼专利代理有限责任公司 32112 代理人 黄明哲
主权项 1.基于图论聚类和色彩不变空间的目标跟踪方法,其特征是包括以下步骤:1)对视频流的图像进行色彩不变空间转换,进行色彩不变特征CSIFT特征提取,检测提取色彩不变、尺度不变特征,计算不变量特征向量;2)特征的图论运动聚类:基于图论,根据特征运动趋势对视频帧进行特征点的聚类,以当前帧为参考图像,后一帧为待匹配图像,以这两帧的CSIFT特征点作为图的节点,获取色彩不变图像下各节点的运动趋势信息,以每两个节点的运动趋势相似度为节点间边的权重,对两帧中的节点同时进行聚类,具有相同运动趋势的特征点属于相同运动状态的目标,通过特征点聚类将相邻两帧视频帧中的同一目标分割出来,实现对视频帧中目标的跟踪;目标跟踪具体为:a)图像预处理,对视频流的帧图像背景建模,去除背景影响;b)依照Kubelka-Munk理论进行色彩不变空间转换,对参考图像I<sub>1</sub>(x,y)和待匹配图像I<sub>2</sub>(x,y)分别求出色彩不变量H<sub>1</sub>(x,y)和H<sub>2</sub>(x,y),以色彩不变量代替图像的灰度值;c)CSIFT特征检测,在色彩不变空间中对H<sub>1</sub>,H<sub>2</sub>用SIFT算法提取特征,并生成色彩不变空间下的SIFT描述子,即CSIFT特征点描述子,包含特征点的坐标、尺度、主方向及128维特征向量信息,在彩色图像上标识;d)图论的运动聚类,基于图论,对视频帧的特征点进行聚类,对相邻两帧中的特征点建立图,进行聚类分类,将检测出的CSIFT特征点作为节点,定义其运动矢量,表征该点运动趋势的概率分布,并将某两个像素运动趋势的相似性反映在边的权重上;采用色彩空间变换后的图像代替灰度图像,以色彩不变量H代替灰度值进行计算,H<sup>t</sup>(X)表示t时刻视频帧二维空间中以特征点X为中心的运算窗体,P<sub>i</sub>(dx)表示第i个节点X<sub>i</sub>对应下一帧运动dx的概率,Dx表示第i个节点所有可能的运动偏移方向;计算P<sub>i</sub>(dx),先计算H<sup>t</sup>(X<sub>i</sub>)和H<sup>t+1</sup>(X<sub>i</sub>+dx)的相似度S<sub>i</sub>(dx),如式(1),其中w属于视频帧二维空间,是H<sup>t</sup>(X<sub>i</sub>)的局部邻域:<maths num="0001"><![CDATA[<math><mrow><msub><mi>S</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>dx</mi><mo>)</mo></mrow><mo>=</mo><mi>exp</mi><mrow><mo>(</mo><mo>-</mo><munder><mrow><mi>&Sigma;</mi><mrow><mo>(</mo><msup><mi>H</mi><mi>t</mi></msup><mrow><mo>(</mo><mi>Xi</mi><mo>+</mo><mi>w</mi><mo>)</mo></mrow><mo>-</mo><msup><mi>H</mi><mrow><mi>t</mi><mo>+</mo><mn>1</mn></mrow></msup><msup><mrow><mrow><mo>(</mo><msub><mi>X</mi><mi>i</mi></msub><mo>+</mo><mi>dx</mi><mo>+</mo><mi>w</mi><mo>)</mo></mrow><mo>)</mo></mrow><mn>2</mn></msup></mrow><mo>/</mo></mrow><mi>w</mi></munder><mi>&sigma;</mi><msup><mi>SSD</mi><mn>2</mn></msup><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow></math>]]></maths>σ<sub>SSD</sub>是点X<sub>i</sub>对所有dx,式(H<sup>t</sup>(X<sub>i</sub>+w)-H<sup>t+1</sup>(X<sub>i</sub>+dx+w))的标准差,将式(1)归一化为概率分布:<maths num="0002"><![CDATA[<math><mrow><msub><mi>P</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>dx</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><msub><mi>S</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>dx</mi><mo>)</mo></mrow></mrow><mrow><msub><mi>&Sigma;</mi><mi>dx</mi></msub><msub><mi>S</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>dx</mi><mo>)</mo></mrow></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow></math>]]></maths>以两个运动趋势的互相关来检测运动相似度,将视频帧中i,j两节点的距离定义为:<maths num="0003"><![CDATA[<math><mrow><mi>d</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>=</mo><mn>1</mn><mo>-</mo><munder><mi>&Sigma;</mi><mi>dx</mi></munder><msub><mi>P</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>dx</mi><mo>)</mo></mrow><msub><mi>P</mi><mi>j</mi></msub><mrow><mo>(</mo><mi>dx</mi><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow></mrow></math>]]></maths>则边(i,j)的权重为:w<sub>ij</sub>=exp(-d(i,j)/σ<sub>m</sub><sup>2</sup>)  (4)σ<sub>m</sub><sup>2</sup>是图中所有d(i,j)的方差;设d(i)=∑<sub>j</sub>w<sub>ij</sub>是节点X<sub>i</sub>与其他所有节点的连接,设视频帧为图G,特征点点集V,将其分为两个点集A,B,A∪B=V,<img file="FDA00002829569700023.GIF" wi="218" he="50" />归一化分割,表示为:<maths num="0004"><![CDATA[<math><mrow><mi>Ncut</mi><mrow><mo>(</mo><mi>A</mi><mo>,</mo><mi>B</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mi>cut</mi><mrow><mo>(</mo><mi>A</mi><mo>,</mo><mi>B</mi><mo>)</mo></mrow></mrow><mrow><mi>asso</mi><mrow><mo>(</mo><mi>A</mi><mo>,</mo><mi>V</mi><mo>)</mo></mrow></mrow></mfrac><mo>+</mo><mfrac><mrow><mi>cut</mi><mrow><mo>(</mo><mi>A</mi><mo>,</mo><mi>B</mi><mo>)</mo></mrow></mrow><mrow><mi>asso</mi><mrow><mo>(</mo><mi>B</mi><mo>,</mo><mi>V</mi><mo>)</mo></mrow></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>5</mn><mo>)</mo></mrow></mrow></math>]]></maths>其中<img file="FDA00002829569700025.GIF" wi="492" he="102" />是A,B两部分的差异程度大小,N是图中节点的总个数,asso(A,V)=∑<sub>u∈A</sub>,<sub>t∈V</sub>w(u,t)是A中节点与图中所有节点的权重和,asso(B,V)是B中节点与图中所有节点的权重和;设D是以d(i)为对角元素的N×N对角矩阵:<maths num="0005"><![CDATA[<math><mrow><mi>D</mi><mo>=</mo><mfenced open='[' close=']'><mtable><mtr><mtd><mi>d</mi><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mtd><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mi>d</mi><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mtd><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mo>.</mo><mo>.</mo><mo>.</mo></mtd><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mi>d</mi><mrow><mo>(</mo><mi>N</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow></mtd><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mi>d</mi><mrow><mo>(</mo><mi>N</mi><mo>)</mo></mrow></mtd></mtr></mtable></mfenced></mrow></math>]]></maths>W是N×N的对称矩阵,W(i,j)=w<sub>ij</sub>;得到瑞利商描述式(6),<maths num="0006"><![CDATA[<math><mrow><msub><mi>min</mi><mi>x</mi></msub><mi>Ncut</mi><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mo>=</mo><msub><mi>min</mi><mi>y</mi></msub><mfrac><mrow><msup><mi>y</mi><mi>T</mi></msup><mrow><mo>(</mo><mi>D</mi><mo>-</mo><mi>W</mi><mo>)</mo></mrow><mi>y</mi></mrow><mrow><msup><mi>y</mi><mi>T</mi></msup><mi>Dy</mi></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>6</mn><mo>)</mo></mrow></mrow></math>]]></maths>通过求解广义特征值方程式(7)间接获得瑞利商:(D-W)y=λDy  (7)求解广义特征值方程式(D-W)y=λDy,将广义特征方程变换为标准特征方程,<img file="FDA00002829569700031.GIF" wi="461" he="103" />其中<img file="FDA00002829569700032.GIF" wi="185" he="103" />利用广义特征值方程式第二小的特征值对图进行二分,分析分类后的稳定性,决定是否需要细分,若要细分使用下一小的特征向量递归分割,直到不需要细分为止,最终得到的各类别的特征点集就是分别属于不同运动目标的,通过特征点集的位置确定目标的位置,实现对目标的跟踪。
地址 210093 江苏省南京市鼓楼区汉口路22号