发明名称 人体骨架运动序列行为识别方法
摘要 本发明公开了一种人体骨架运动序列行为识别方法。其中,该方法包括获取人体骨架节点坐标;将人体骨架各肢体对应的节点进行串接,形成四肢和躯干的运动特征表达;将四肢和躯干的运动特征表达进行串接,形成人体骨架的向量表达;将人体骨架运动序列中各帧所对应的向量表达,按照时间顺序排列,得到三维矩阵;对三维矩阵中的数值做归一化和维度归一化,得到人体骨架序列对应的图像表达;采用卷积神经网络来自适应地提取图像表达中的纹理特征表达;基于该纹理特征表达进行行为类别判定,并以投票的方式确定人体骨架序列所属的行为类别。本发明实施例无需复杂的数据预处理,即可根据人体骨架坐标序列对人的行为进行精确识别。
申请公布号 CN106203363A 申请公布日期 2016.12.07
申请号 CN201610562181.6 申请日期 2016.07.15
申请人 中国科学院自动化研究所 发明人 王亮;杜勇
分类号 G06K9/00(2006.01)I;G06K9/46(2006.01)I;G06K9/62(2006.01)I;G06N3/08(2006.01)I 主分类号 G06K9/00(2006.01)I
代理机构 北京瀚仁知识产权代理事务所(普通合伙) 11482 代理人 宋宝库
主权项 一种人体骨架运动序列行为识别方法,其特征在于,所述方法至少包括:获取所述人体骨架节点坐标;其中,一系列连续时刻的所述人体骨架构成所述人体骨架运动序列;将所述人体骨架各肢体对应的节点进行串接,形成四肢和躯干的运动特征表达;将所述四肢和所述躯干的运动特征表达进行串接,形成人体骨架的向量表达;将所述人体骨架运动序列中各帧所对应的所述向量表达,按照时间顺序排列,得到三维矩阵;对所述三维矩阵中的数值做归一化和维度归一化,得到人体骨架序列对应的图像表达;采用卷积神经网络来自适应地提取所述图像表达中的纹理特征表达;将所述纹理特征表达通过全连接神经网络层映射为维度与数据库中所含行为类别总数相同的向量,并通过软最大化层归一化,确定所述人体骨架的类属概率;最小化以下最大似然损失函数:<maths num="0001"><math><![CDATA[<mrow><mi>L</mi><mrow><mo>(</mo><mi>&Omega;</mi><mo>)</mo></mrow><mo>=</mo><mo>-</mo><munderover><mo>&Sigma;</mo><mrow><mi>m</mi><mo>=</mo><mn>0</mn></mrow><mrow><mi>M</mi><mo>-</mo><mn>1</mn></mrow></munderover><mi>l</mi><mi>n</mi><munderover><mo>&Sigma;</mo><mrow><mi>k</mi><mo>=</mo><mn>0</mn></mrow><mrow><mi>C</mi><mo>-</mo><mn>1</mn></mrow></munderover><mi>&delta;</mi><mrow><mo>(</mo><mi>k</mi><mo>-</mo><mi>r</mi><mo>)</mo></mrow><mi>p</mi><mrow><mo>(</mo><msub><mi>C</mi><mi>k</mi></msub><mo>|</mo><msub><mi>x</mi><mi>m</mi></msub><mo>)</mo></mrow></mrow>]]></math><img file="FDA0001051177540000011.GIF" wi="1222" he="183" /></maths>其中,所述M表示数据库中的所述人体骨架运动序列样本的总量;所述δ(·)表示Kronecker函数;所述C表示行为类别总数;所述k表示行为项数;所述p(C<sub>k</sub>|x<sub>m</sub>)表示所述第m个人体骨架运动序列样本x<sub>m</sub>隶属于第k个行为C<sub>k</sub>的类属概率;所述r为人体骨架运动序列样本x<sub>m</sub>对应真实行为类别标号;所述L(Ω)表示最大似然损失函数;从所述人体骨架序列对应的图像表达及其翻转图像中确定四个角部区域和中心区域,分别进行行为类别判定,并以投票的方式确定所述人体骨架序列所属的行为类别。
地址 100080 北京市海淀区中关村东路95号
您可能感兴趣的专利