主权项 |
一种人体动作识别的方法,其特征在于,如下包括步骤:第一步,捕获运动人体的大致位置和轮廓;第二步,计算运动人体的空间特征,获得前帧人体的轮廓直方图、横向即x方向及纵向即y方向的光流直方图,并把计算结果拼接成一个216维的特征向量;第三步,计算运动人体的时间特征,将当前帧和其前、后各7帧放在一起组成一段长15帧的片段,并采用局部线性嵌入法将1~5帧,6~10帧,及11~15帧的特征向量分别降至50,100,50维;第四步,形成描述当前帧人体运动姿态的最终特征向量,即将第二、三步获得的特征进行组合得到最终的特征向量,共计416维;第五步,建立图模型G:将待分类的动作序列切成一帧一帧的图片形式,并和已知动作图片放在一起建立K近邻图G;第六步,求解广义拉普拉斯矩阵<img file="FDA0000869779620000011.GIF" wi="79" he="70" />根据图G的邻接矩阵W和相应的度矩阵D,计算广义拉普拉斯矩阵<img file="FDA0000869779620000012.GIF" wi="70" he="71" />第七步,获得每一帧的标签向量F<sub>i</sub>:将广义拉普拉斯矩阵<img file="FDA0000869779620000013.GIF" wi="53" he="70" />代入预设的目标函数并进行求解,从而对于视频序列中的每一帧图片i都能获得一个标签向量F<sub>i</sub>;第八步,识别结果输出:向量F<sub>i</sub>中最大元素所在的列代表的动作类别即为第i帧中人体正在执行的动作。 |