发明名称 |
基于人脑视觉记忆原理的人体动作识别方法及系统 |
摘要 |
本发明公开了一种基于人脑视觉记忆原理的人体动作识别方法及系统,涉及计算机视觉和视频监控领域。本发明受人脑视觉记忆原理启发,首次提出以下技术方案:在训练阶段,使用局部特征的特征编码训练分类器模型,并使用该特征编码来构建视觉记忆库;在识别阶段,在视觉记忆库中检索待识别视频中局部特征的特征编码;用检索结果中视频的部分局部特征,替换待识别视频中被遮挡的信息,对替换后的视频的局部特征进行特征编码,并输入训练模型进行测试,获得视频中人体动作的类别。本发明能有效解决人体动作识别中的遮挡问题。 |
申请公布号 |
CN105023000A |
申请公布日期 |
2015.11.04 |
申请号 |
CN201510407799.0 |
申请日期 |
2015.07.13 |
申请人 |
中南民族大学 |
发明人 |
谌先敢;刘海华;高智勇;李旭 |
分类号 |
G06K9/00(2006.01)I;G06K9/62(2006.01)I |
主分类号 |
G06K9/00(2006.01)I |
代理机构 |
北京捷诚信通专利事务所(普通合伙) 11221 |
代理人 |
王卫东 |
主权项 |
一种基于人脑视觉记忆原理的人体动作识别方法,其特征在于,包括以下步骤:A、训练阶段:A1、采集多个训练视频,对每个训练视频分别进行密集采样,将采样块上的方向梯度直方图HOG特征作为局部特征,得到训练视频的HOG特征集合;A2、采用期望最大化算法,对步骤A1得到的训练视频的HOG特征集合进行学习,得到一组“超完备”基向量;A3、结合步骤A2得到的“超完备”基向量,采用稀疏编码的方式,对步骤A1得到的训练视频的HOG特征集合进行特征编码,得到第一稀疏向量集合,第一稀疏向量集合中每个向量的维度与“超完备”基向量的维度相同,对第一稀疏向量集合中的全部稀疏向量进行求和运算,再进行归一化,得到一个维度与“超完备”基向量维度相同的向量,作为训练视频的编码结果,用训练视频的编码结果来表达训练视频中的人体动作;A4、将步骤A3得到的所有训练视频的编码结果送入支持向量机SVM分类器进行训练,生成训练模型;A5、使用步骤A3得到的所有训练视频的编码结果,来构建视觉记忆库;B、识别阶段:B1、输入待识别视频,对待识别视频进行密集采样,将采样块上的HOG特征作为局部特征,得到待识别视频的HOG特征集合;B2、结合步骤A2得到的“超完备”基向量,采用稀疏编码的方式,对步骤B1得到的待识别视频的HOG特征集合进行特征编码,到得第二稀疏向量集合,第二稀疏向量集合中每个向量的维度与“超完备”基向量维度相同,对第二稀疏向量集合中的全部稀疏向量进行求和运算,再进行归一化,得到一个维度与“超完备”基向量维度相同的稀疏向量;B3、确定待识别视频中被遮挡的部位,用视觉记忆库中的检索结果替换待识别视频中被遮挡的部位,得到待识别视频的编码结果:以步骤B2得到的稀疏向量为索引,在步骤A5构建的视觉记忆库中进行检索,将检索出的视频作为检索结果,用检索结果中视频的局部特征替换待识别视频中被遮挡部位的特征,得到经过替换后的视频的HOG特征集合,作为新的局部特征;用步骤A2得到的“超完备”基向量对该新的局部特征进行特征编码,得到新的稀疏向量,作为待识别视频的编码结果,用待识别视频的编码结果来表达待识别视频中的人体动作;B4、将步骤B3得到的待识别视频的编码结果送入步骤A4生成的训练模型进行测试,得到待识别视频中的人体动作类别。 |
地址 |
430074 湖北省武汉市洪山区民族大道182号 |