发明名称 一种基于两层时空邻域特征的动作识别方法
摘要 本发明公开一种基于两层时空邻域特征的动作识别方法,包括:对输入的视频,根据视频中连续帧的运动方向变化信息,提取运动变化模式特征作为视频的第一层原始特征。对第一层特征采用改进的词袋模型进行特征建模,得到第一层特征的向量表示。根据第一层中的每个局部兴趣点和最近邻若干兴趣点之间的时空关系,计算出第二层时空特征。对第二层特征采用改进的词袋模型进行特征建模,得到第二层特征的向量表示。将第一、二层的向量表示级联,形成视频最终的中层特征表达。采用支持向量机进行特征分类,得到识别准确率。本发明能有效地获取最近邻兴趣点的相对位置信息和类别信息,并结合了改进的词袋模型方法进行特征建模,显著提高了动作识别的准确率。
申请公布号 CN105956604A 申请公布日期 2016.09.21
申请号 CN201610249150.5 申请日期 2016.04.20
申请人 广东顺德中山大学卡内基梅隆大学国际联合研究院 发明人 胡海峰;肖翔;张伟;顾建权
分类号 G06K9/62(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 广州粤高专利商标代理有限公司 44102 代理人 林丽明
主权项 一种基于两层时空邻域特征的动作识别方法,其特征在于,包括以下步骤:(1)输入待识别的视频,根据视频中连续帧的运动方向变化信息,提取运动变化模式特征作为视频的第一层原始特征;(2)对第一层原始特征采用包含k‑means++聚类方法的改进词袋模型进行特征建模,得到第一层原始特征的向量表示;(3)根据第一层原始特征中的每个局部兴趣点和最近邻若干兴趣点之间的时空关系,计算出第二层时空特征;(4)对第二层时空特征同样采用改进的词袋模型进行特征建模,得到第二层时空特征的向量表示;(5)将第一层原始特征和第二层时空特征的向量表示级联起来,形成该视频最终的中层特征表达;(6)采用支持向量机(SVM)进行特征分类,最终输出动作视频的识别准确率;所述改进的词袋模型的具体实现包括数据聚类和计算统计频率直方图这两个步骤,其聚类是采用k‑means++方法k‑means++方法的描述如下:(3‑1)从输入的数据点集合中随机选择一个点作为第一个聚类中心;(3‑2)对于数据集中的每一个点x,计算它与已选择的聚类中心中最近的聚类中心的距离D(x);(3‑3)选择一个新的数据点作为新的聚类中心,其选择的原则是:D(x)较大的点,被选取作为聚类中心的概率较大;(3‑4)重复步骤(3‑2)和(3‑3)直到k个聚类中心被选出来;(3‑5)利用这k个初始的聚类中心来运行标准的k‑means算法。
地址 528300 广东省佛山市顺德区大良南国东路9号研究院