基于图论聚类和色彩不变空间的目标跟踪方法,申请号CN201110181318.0-传众专利搜索

发明名称	基于图论聚类和色彩不变空间的目标跟踪方法
摘要	基于图论聚类和色彩不变空间的目标跟踪方法，包括以下步骤：1)对视频流的图像进行色彩不变空间转换，用色彩不变特征CSIFT特征提取特征点；2)特征的图论运动聚类，具有相同运动趋势的特征点属于相同运动状态的目标，由特征点跟踪到视频帧中的目标。本发明采用局部不变特征，摒弃全局特征的盲目性；实现色彩不变特征CSIFT提取，在保持SIFT特征几何不变性优势的同时增加了色彩不变性，从灰度特征空间提升为彩色空间；针对静止背景下的运动物体，将图论思想融入匹配，将特征运动分类作为匹配的预处理，使匹配操作更加准确、快速。
申请公布号	CN102236901B	申请公布日期	2013.06.05
申请号	CN201110181318.0	申请日期	2011.06.30
申请人	南京大学	发明人	李勃;陈抒瑢;董蓉;翟霄宇;顾昊;丁文;杨娴;陈启美;郁建桥;徐亮
分类号	G06T7/20(2006.01)I;G06K9/62(2006.01)I	主分类号	G06T7/20(2006.01)I
代理机构	南京天翼专利代理有限责任公司 32112	代理人	黄明哲
主权项	1.基于图论聚类和色彩不变空间的目标跟踪方法，其特征是包括以下步骤：1）对视频流的图像进行色彩不变空间转换，进行色彩不变特征CSIFT特征提取，检测提取色彩不变、尺度不变特征，计算不变量特征向量；2）特征的图论运动聚类：基于图论，根据特征运动趋势对视频帧进行特征点的聚类，以当前帧为参考图像，后一帧为待匹配图像，以这两帧的CSIFT特征点作为图的节点，获取色彩不变图像下各节点的运动趋势信息，以每两个节点的运动趋势相似度为节点间边的权重，对两帧中的节点同时进行聚类，具有相同运动趋势的特征点属于相同运动状态的目标，通过特征点聚类将相邻两帧视频帧中的同一目标分割出来，实现对视频帧中目标的跟踪；目标跟踪具体为：a)图像预处理，对视频流的帧图像背景建模，去除背景影响；b）依照Kubelka-Munk理论进行色彩不变空间转换，对参考图像I<sub>1</sub>(x,y)和待匹配图像I<sub>2</sub>(x,y)分别求出色彩不变量H<sub>1</sub>(x,y)和H<sub>2</sub>(x,y)，以色彩不变量代替图像的灰度值；c）CSIFT特征检测，在色彩不变空间中对H<sub>1</sub>,H<sub>2</sub>用SIFT算法提取特征，并生成色彩不变空间下的SIFT描述子，即CSIFT特征点描述子，包含特征点的坐标、尺度、主方向及128维特征向量信息，在彩色图像上标识；d）图论的运动聚类，基于图论，对视频帧的特征点进行聚类，对相邻两帧中的特征点建立图，进行聚类分类，将检测出的CSIFT特征点作为节点，定义其运动矢量，表征该点运动趋势的概率分布，并将某两个像素运动趋势的相似性反映在边的权重上；采用色彩空间变换后的图像代替灰度图像，以色彩不变量H代替灰度值进行计算，H<sup>t</sup>(X)表示t时刻视频帧二维空间中以特征点X为中心的运算窗体，P<sub>i</sub>(dx)表示第i个节点X<sub>i</sub>对应下一帧运动dx的概率，Dx表示第i个节点所有可能的运动偏移方向；计算P<sub>i</sub>(dx)，先计算H<sup>t</sup>(X<sub>i</sub>)和H<sup>t+1</sup>(X<sub>i</sub>+dx)的相似度S<sub>i</sub>(dx)，如式(1)，其中w属于视频帧二维空间，是H<sup>t</sup>(X<sub>i</sub>)的局部邻域：<maths num="0001"><![CDATA[<math><mrow><msub><mi>S</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>dx</mi><mo>)</mo></mrow><mo>=</mo><mi>exp</mi><mrow><mo>(</mo><mo>-</mo><munder><mrow><mi>Σ</mi><mrow><mo>(</mo><msup><mi>H</mi><mi>t</mi></msup><mrow><mo>(</mo><mi>Xi</mi><mo>+</mo><mi>w</mi><mo>)</mo></mrow><mo>-</mo><msup><mi>H</mi><mrow><mi>t</mi><mo>+</mo><mn>1</mn></mrow></msup><msup><mrow><mrow><mo>(</mo><msub><mi>X</mi><mi>i</mi></msub><mo>+</mo><mi>dx</mi><mo>+</mo><mi>w</mi><mo>)</mo></mrow><mo>)</mo></mrow><mn>2</mn></msup></mrow><mo>/</mo></mrow><mi>w</mi></munder><mi>σ</mi><msup><mi>SSD</mi><mn>2</mn></msup><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow></math>]]></maths>σ<sub>SSD</sub>是点X<sub>i</sub>对所有dx，式(H<sup>t</sup>(X<sub>i</sub>+w)-H<sup>t+1</sup>(X<sub>i</sub>+dx+w))的标准差，将式(1)归一化为概率分布：<maths num="0002"><![CDATA[<math><mrow><msub><mi>P</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>dx</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><msub><mi>S</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>dx</mi><mo>)</mo></mrow></mrow><mrow><msub><mi>Σ</mi><mi>dx</mi></msub><msub><mi>S</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>dx</mi><mo>)</mo></mrow></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow></math>]]></maths>以两个运动趋势的互相关来检测运动相似度，将视频帧中i,j两节点的距离定义为：<maths num="0003"><![CDATA[<math><mrow><mi>d</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>=</mo><mn>1</mn><mo>-</mo><munder><mi>Σ</mi><mi>dx</mi></munder><msub><mi>P</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>dx</mi><mo>)</mo></mrow><msub><mi>P</mi><mi>j</mi></msub><mrow><mo>(</mo><mi>dx</mi><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow></mrow></math>]]></maths>则边(i,j)的权重为：w<sub>ij</sub>＝exp(-d(i,j)/σ<sub>m</sub><sup>2</sup>) (4)σ<sub>m</sub><sup>2</sup>是图中所有d(i,j)的方差；设d(i)=∑<sub>j</sub>w<sub>ij</sub>是节点X<sub>i</sub>与其他所有节点的连接，设视频帧为图G，特征点点集V，将其分为两个点集A,B,A∪B=V,<img file="FDA00002829569700023.GIF" wi="218" he="50" />归一化分割，表示为：<maths num="0004"><![CDATA[<math><mrow><mi>Ncut</mi><mrow><mo>(</mo><mi>A</mi><mo>,</mo><mi>B</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mi>cut</mi><mrow><mo>(</mo><mi>A</mi><mo>,</mo><mi>B</mi><mo>)</mo></mrow></mrow><mrow><mi>asso</mi><mrow><mo>(</mo><mi>A</mi><mo>,</mo><mi>V</mi><mo>)</mo></mrow></mrow></mfrac><mo>+</mo><mfrac><mrow><mi>cut</mi><mrow><mo>(</mo><mi>A</mi><mo>,</mo><mi>B</mi><mo>)</mo></mrow></mrow><mrow><mi>asso</mi><mrow><mo>(</mo><mi>B</mi><mo>,</mo><mi>V</mi><mo>)</mo></mrow></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>5</mn><mo>)</mo></mrow></mrow></math>]]></maths>其中<img file="FDA00002829569700025.GIF" wi="492" he="102" />是A,B两部分的差异程度大小，N是图中节点的总个数，asso(A,V)=∑<sub>u∈A</sub>，<sub>t∈V</sub>w(u,t)是A中节点与图中所有节点的权重和，asso(B,V)是B中节点与图中所有节点的权重和；设D是以d(i)为对角元素的N×N对角矩阵：<maths num="0005"><![CDATA[<math><mrow><mi>D</mi><mo>=</mo><mfenced open='[' close=']'><mtable><mtr><mtd><mi>d</mi><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mtd><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mi>d</mi><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mtd><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mo>.</mo><mo>.</mo><mo>.</mo></mtd><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mi>d</mi><mrow><mo>(</mo><mi>N</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow></mtd><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mi>d</mi><mrow><mo>(</mo><mi>N</mi><mo>)</mo></mrow></mtd></mtr></mtable></mfenced></mrow></math>]]></maths>W是N×N的对称矩阵，W(i,j)＝w<sub>ij</sub>；得到瑞利商描述式(6)，<maths num="0006"><![CDATA[<math><mrow><msub><mi>min</mi><mi>x</mi></msub><mi>Ncut</mi><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mo>=</mo><msub><mi>min</mi><mi>y</mi></msub><mfrac><mrow><msup><mi>y</mi><mi>T</mi></msup><mrow><mo>(</mo><mi>D</mi><mo>-</mo><mi>W</mi><mo>)</mo></mrow><mi>y</mi></mrow><mrow><msup><mi>y</mi><mi>T</mi></msup><mi>Dy</mi></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>6</mn><mo>)</mo></mrow></mrow></math>]]></maths>通过求解广义特征值方程式(7)间接获得瑞利商：(D-W)y＝λDy (7)求解广义特征值方程式(D-W)y＝λDy，将广义特征方程变换为标准特征方程，<img file="FDA00002829569700031.GIF" wi="461" he="103" />其中<img file="FDA00002829569700032.GIF" wi="185" he="103" />利用广义特征值方程式第二小的特征值对图进行二分，分析分类后的稳定性，决定是否需要细分，若要细分使用下一小的特征向量递归分割，直到不需要细分为止，最终得到的各类别的特征点集就是分别属于不同运动目标的，通过特征点集的位置确定目标的位置，实现对目标的跟踪。
地址	210093 江苏省南京市鼓楼区汉口路22号