发明名称 | 基于稀疏编码张量分解的动作识别方法 | ||
摘要 | 一种基于稀疏编码张量分解的动作识别方法:将原始的视频序列表征为一个三阶的视频序列张量<img file="DDA0001138280560000011.GIF" wi="251" he="55" />T表示视频序列长度,I<sub>1</sub>×I<sub>2</sub>表示视频帧的大小;对三阶的视频序列张量<img file="DDA0001138280560000012.GIF" wi="226" he="55" />进行Tucker分解获得空域维度减少的核张量;将视频序列张量缩放到相同的尺度;动态学上述过程更新结果直到算法收敛结果达到最优。本发明的基于稀疏编码张量分解的动作识别方法,能够将视频序列处理为统一的长度——稀疏编码张量分解技术。在这个过程中通过在张量分解的框架中适应性挑选出信息量最多的帧去构建出具有统一视频序列长度的新的视频序列。本发明的方法降低了手势识别的难度,提高了手势识别的准确性,为后续的视频序列分类提供了良好的条件,提升视频序列分类的准确率。 | ||
申请公布号 | CN106503659A | 申请公布日期 | 2017.03.15 |
申请号 | CN201610933077.3 | 申请日期 | 2016.10.24 |
申请人 | 天津大学 | 发明人 | 苏育挺;徐传忠;张静 |
分类号 | G06K9/00(2006.01)I | 主分类号 | G06K9/00(2006.01)I |
代理机构 | 天津市北洋有限责任专利代理事务所 12201 | 代理人 | 杜文茹 |
主权项 | 一种基于稀疏编码张量分解的动作识别方法,其特征在于,包括如下步骤:1)将原始的视频序列表征为一个三阶的视频序列张量<img file="FDA0001138280530000011.GIF" wi="250" he="55" />T表示视频序列长度,I<sub>1</sub>×I<sub>2</sub>表示视频帧的大小;2)对三阶的视频序列张量<img file="FDA0001138280530000012.GIF" wi="223" he="55" />进行Tucker分解获得空域维度减少的核张量;3)将视频序列张量缩放到相同的尺度;4)动态学习步骤2)和步骤3)更新结果直到算法收敛结果达到最优。 | ||
地址 | 300072 天津市南开区卫津路92号 |