发明名称 一种人体动作识别的方法
摘要 本发明公开一种计算机视觉与模式识别领域的人体动作识别的方法,首先使用了一种包含时间和空间信息的特征来表达当前帧人体的运动状态,然后再通过一种图论半监督方法设计分类器,从而达到识别人体动作的目的。本发明在提取人体运动特征的过程中同时融合了过去、当前及未来时刻的轮廓及运动光流信息,因而能够更加准确地描述人体的动作姿态。另外,为了用较少的样本获得较高的识别率;基于广义拉普拉斯矩阵的图论半监督方法,并将其用于人体动作识别。实验证明本发明提出的方法在观察角度不同、人与人之间动作存在差异的情况下都能够对常见动作取得令人满意的识别率。
申请公布号 CN103164694B 申请公布日期 2016.06.01
申请号 CN201310054812.X 申请日期 2013.02.20
申请人 上海交通大学 发明人 宫辰;傅可人;杨杰
分类号 G06K9/00(2006.01)I 主分类号 G06K9/00(2006.01)I
代理机构 上海汉声知识产权代理有限公司 31236 代理人 郭国中
主权项 一种人体动作识别的方法,其特征在于,如下包括步骤:第一步,捕获运动人体的大致位置和轮廓;第二步,计算运动人体的空间特征,获得前帧人体的轮廓直方图、横向即x方向及纵向即y方向的光流直方图,并把计算结果拼接成一个216维的特征向量;第三步,计算运动人体的时间特征,将当前帧和其前、后各7帧放在一起组成一段长15帧的片段,并采用局部线性嵌入法将1~5帧,6~10帧,及11~15帧的特征向量分别降至50,100,50维;第四步,形成描述当前帧人体运动姿态的最终特征向量,即将第二、三步获得的特征进行组合得到最终的特征向量,共计416维;第五步,建立图模型G:将待分类的动作序列切成一帧一帧的图片形式,并和已知动作图片放在一起建立K近邻图G;第六步,求解广义拉普拉斯矩阵<img file="FDA0000869779620000011.GIF" wi="79" he="70" />根据图G的邻接矩阵W和相应的度矩阵D,计算广义拉普拉斯矩阵<img file="FDA0000869779620000012.GIF" wi="70" he="71" />第七步,获得每一帧的标签向量F<sub>i</sub>:将广义拉普拉斯矩阵<img file="FDA0000869779620000013.GIF" wi="53" he="70" />代入预设的目标函数并进行求解,从而对于视频序列中的每一帧图片i都能获得一个标签向量F<sub>i</sub>;第八步,识别结果输出:向量F<sub>i</sub>中最大元素所在的列代表的动作类别即为第i帧中人体正在执行的动作。
地址 200240 上海市闵行区东川路800号