发明名称 一种基于稀疏低秩的人体行为识别方法
摘要 本发明属于数字图像处理技术领域,涉及计算机视觉、模式识别、机器学和数据挖掘等相关理论知识。本发明首先利用光流直方图对相邻两帧图片提取光流特征,并对单帧图像提取梯度直方图信息,获得监测场景内的运动特征信息,采用低维空间的特征信息并按照[动作1|动作2|动作3|……]的方式排列;然后用K均值的方式聚类,得到聚类中心后,将聚类中心作为过完备字典,求解测试样本在过完备字典下的稀疏低秩表达,得到表达矩阵;最后根据表达矩阵中的最大值求解出该测试样本所属的行为类别。本发明采用基于低秩稀疏的人体动作识别,采用交叉验证的方法,识别率92.3~98.79%,误识率1.21~7.6%。本发明具有低秩特点,且识别率上达到92.3~98.79%,误识率1.21~7.6%。
申请公布号 CN105868711A 申请公布日期 2016.08.17
申请号 CN201610184336.7 申请日期 2016.03.28
申请人 电子科技大学 发明人 解梅;程石磊;王博;周扬
分类号 G06K9/00(2006.01)I;G06K9/62(2006.01)I 主分类号 G06K9/00(2006.01)I
代理机构 电子科技大学专利中心 51203 代理人 张杨
主权项 一种基于稀疏低秩的人体行为识别方法,具体步骤如下:步骤1、视频图像灰度转换并提取场景特征步骤1‑1:首先接收监测设备采集到的视频流,对得到的单帧图像进行灰度化处理。步骤1‑2:将每帧图片归一化成96*48的大小;每个cell的大小为8*8的像素点,每个block中包含2*2个cell即16*16的像素点;相邻block有一半的区域是重叠的;梯度方向分为9个方向,得到的一张图片的梯度直方图HOG特征向量为1980维;对连续两帧灰度图像在3*3的网格中提取光流直方图特征HOF,即每3*3的网格求出一个光流特征向量,根据视频帧的不同大小得到N个光流特征向量,将光流范围0~2π等分成32个子空间,构建32维的直方图B,在统计直方图时,根据角度值对应位置投票,投票所得结果作为权值,因此得权值向量h=[h<sub>k</sub>],k={1,2,3…,K},其中k为每个网格的索引值,K是网格总数,h<sub>k</sub>为第k个网格中32维直方图B对应的权值;步骤2、特征聚类设光流特征向量x=[x<sub>i</sub>],i={1,2,3…,m},对于每一个特征向量,动作类型计算公式:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msup><mi>C</mi><mrow><mo>(</mo><mi>j</mi><mo>)</mo></mrow></msup><mo>=</mo><munder><mi>argmin</mi><mi>j</mi></munder><mo>|</mo><mo>|</mo><msup><mi>x</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></msup><mo>-</mo><msub><mi>&mu;</mi><mi>j</mi></msub><mo>|</mo><msup><mo>|</mo><mn>2</mn></msup><mo>,</mo><mi>j</mi><mo>=</mo><mo>{</mo><mn>1</mn><mo>,</mo><mn>2</mn><mo>,</mo><mn>3</mn><mo>...</mo><mo>,</mo><mi>K</mi><mo>}</mo></mrow>]]></math><img file="FDA0000951325430000011.GIF" wi="945" he="118" /></maths>对于每类动作C<sup>(j)</sup>j,计算该类质心<img file="FDA0000951325430000012.GIF" wi="415" he="112" />这里K表示聚类中心,取值500~2000;步骤3、低秩稀疏表达步骤3‑1:将聚类中心构成的字典D=[d<sub>k</sub>],k={1,2,3…,n},则X为一个d<sub>s</sub>×n的矩阵,d<sub>s</sub>为特征维度,识别样本集X=[x<sub>k</sub>],k={1,2,3…,n},X中的任意一列x<sub>i</sub>都可以用D进行线性表达,将这种关系式写为:X=DZ+E,其中Z的每一列表示X的对应列用D进行线性表达的系数,矩阵Z称之为表达子,E为由噪声引起的误差;步骤3‑2:据此建立目标方程:argmin<sub>Z,E</sub>||Z||<sub>*</sub>+β||Z||<sub>1</sub>+γ||E||<sub>1</sub> s.t.X=DZ+E式1其中β和γ分别表示各项的关注因子,它们的值越大,表示相关项越受关注,这里β=2,γ=2,公式中分别用核范数和L1范数求解低秩和稀疏问题;步骤3‑3:求解步骤3‑2中的式1,这里用到了增广拉格朗日乘数法,得到目标函数后分别对各个参数进行迭代优化,则参数的迭代过程为:<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><msub><mi>Z</mi><mrow><mi>k</mi><mo>+</mo><mn>1</mn></mrow></msub><mo>=</mo><msub><mi>J</mi><msup><mrow><mo>(</mo><mrow><msub><mi>&eta;&mu;</mi><mi>k</mi></msub></mrow><mo>)</mo></mrow><mrow><mo>-</mo><mn>1</mn></mrow></msup></msub><mrow><mo>(</mo><msub><mi>Z</mi><mi>k</mi></msub><mo>+</mo><mfrac><mrow><mi>Q</mi><mrow><mo>(</mo><mi>D</mi><mo>,</mo><mi>X</mi><mo>,</mo><msub><mi>Z</mi><mi>k</mi></msub><mo>,</mo><msub><mi>Y</mi><mrow><mn>1</mn><mo>,</mo><mi>k</mi></mrow></msub><mo>,</mo><msub><mi>Y</mi><mrow><mn>2</mn><mo>,</mo><mi>k</mi></mrow></msub><mo>,</mo><msub><mi>&mu;</mi><mi>k</mi></msub><mo>)</mo></mrow></mrow><mi>&eta;</mi></mfrac><mo>)</mo></mrow><mo>;</mo></mrow>]]></math><img file="FDA0000951325430000013.GIF" wi="853" he="100" /></maths>其中<img file="FDA0000951325430000014.GIF" wi="1532" he="103" /><maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><msub><mi>W</mi><mrow><mi>k</mi><mo>+</mo><mn>1</mn></mrow></msub><mo>=</mo><msub><mi>&Theta;</mi><mrow><msubsup><mi>&beta;&mu;</mi><mi>k</mi><mrow><mo>-</mo><mn>1</mn></mrow></msubsup></mrow></msub><mrow><mo>(</mo><msub><mi>Z</mi><mrow><mi>k</mi><mo>+</mo><mn>1</mn></mrow></msub><mo>+</mo><mfrac><msub><mi>Y</mi><mrow><mn>2</mn><mo>,</mo><mi>k</mi></mrow></msub><msub><mi>&mu;</mi><mi>k</mi></msub></mfrac><mo>)</mo></mrow><mo>,</mo></mrow>]]></math><img file="FDA0000951325430000021.GIF" wi="580" he="103" /></maths><maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><msub><mi>E</mi><mrow><mi>k</mi><mo>+</mo><mn>1</mn></mrow></msub><mo>=</mo><msub><mi>&Theta;</mi><mrow><msubsup><mi>&gamma;&mu;</mi><mi>k</mi><mrow><mo>-</mo><mn>1</mn></mrow></msubsup></mrow></msub><mrow><mo>(</mo><mi>X</mi><mo>-</mo><msub><mi>DZ</mi><mrow><mi>k</mi><mo>+</mo><mn>1</mn></mrow></msub><mo>+</mo><mfrac><msub><mi>Y</mi><mrow><mn>1</mn><mo>,</mo><mi>k</mi></mrow></msub><msub><mi>&mu;</mi><mi>k</mi></msub></mfrac><mo>)</mo></mrow><mo>,</mo></mrow>]]></math><img file="FDA0000951325430000022.GIF" wi="700" he="102" /></maths>Y<sub>1,k+1</sub>=Y<sub>1,k</sub>+μ<sub>k</sub>(X‑DZ<sub>k+1</sub>‑E<sub>k+1</sub>),Y<sub>2,k+1</sub>=Y<sub>2,k</sub>+μ<sub>k</sub>(Z<sub>k+1</sub>‑W<sub>K+1</sub>),μ<sub>k+1</sub>=ρμ<sub>k</sub>,其中函数J和Θ分别表示奇异值压缩算子和压缩算子,<img file="FDA0000951325430000023.GIF" wi="188" he="70" />ρ=1.1,各参量的初始值为Z<sub>0</sub>=W<sub>0</sub>=E<sub>0</sub>=Y<sub>1,0</sub>=Y<sub>2,0</sub>=0;步骤4、行为识别步骤4‑1、通过步骤3求得的稀疏低秩矩阵Z,其中Z的每一列就是待识别样本在D中的线性表达,现在只需要找出表达最大的那个系数即可知道待识别样本所属的类别,采用最大池化法,即找出矩阵Z中每一行的最大值;令y<sub>i</sub>=max(|z<sub>i1</sub>|,|z<sub>i2</sub>|,…|z|<sub>in</sub>),i=1,2,…l;步骤4‑2、得到矩阵Z中每一行的最大值y<sub>i</sub>,取最大值中的前十个,分别找出这十个值所对应的相应类别,并计算该类别在矩阵Z中对应的系数,并把相同类别的系数叠加起来,得到的最大值所对应的类别即为最终的识别结果,相应的计算公式如下:y<sub>i</sub>=max(|z<sub>i1</sub>|,|z<sub>i2</sub>|,...|zin|),i=1,2,...T上式表示取Z中行向量中最大值的前T个;分别找出对应的P<sub>j</sub>=C<sub>i</sub>(y<sub>i</sub>),i=1,2,…T,其中C<sub>i</sub>(y<sub>i</sub>)为步骤2的聚类结果;<img file="FDA0000951325430000024.GIF" wi="1078" he="77" />其中δ(·)是Dirac Delta函数,PreC即为最终的识别结果,T取5~10。
地址 611731 四川省成都市高新区(西区)西源大道2006号