发明名称 基于深度核信息图像特征的人体运动跟踪方法
摘要 本发明公开了一种基于深度核信息图像特征的人体运动跟踪方法,主要解决现有技术的人体运动跟踪中对视频图像特征表示不准确,导致跟踪结果不精确的问题。其实现过程为:从数据库中获得视频图像的关节点三维坐标矩阵Y;提取处理后视频图像的深度核信息图像特征X;以提取的深度核信息图像特征X为输入,以视频图像中人体的三维坐标矩阵Y为输出,使用高斯过程学回归函数;使用高斯过程学得到的回归函数,以新的视频图像的深度核信息特征X为输入,估计出运动人体的三维姿态数据。本发明具有比现有的人体跟踪方法训练过程快,对图像特征表示准确的优点,可用于运动捕获,人机交互,视频监控,人体目标识别和三维姿势恢复。
申请公布号 CN103093211B 申请公布日期 2015.09.30
申请号 CN201310030672.2 申请日期 2013.01.27
申请人 西安电子科技大学 发明人 韩红;谢福强;张红蕾;韩启强;李晓君;顾建银
分类号 G06K9/00(2006.01)I;G06K9/62(2006.01)I 主分类号 G06K9/00(2006.01)I
代理机构 陕西电子工业专利中心 61205 代理人 王品华;朱红星
主权项 一种基于深度核信息图像特征的人体运动跟踪方法包括如下步骤:(1)从原始的视频图像中获得人体关节点的三维坐标矩阵Y;(2)提取训练视频图像的核图像特征x(U):2a)输入待处理训练视频图像集转换为连续单幅序列图,根据图像内容,判断需要识别的主要人体目标,提取像素大小为64×192的含有人体的矩形框体,作为之后处理的训练样本图像集U;2b)对训练样本图像集U中的像素点分别求梯度,得到每一个像素点的方向<img file="FDA0000752603210000017.GIF" wi="44" he="75" />和模值<img file="FDA0000752603210000018.GIF" wi="89" he="68" />其中,z为图像块中的像素点,z∈U;2c)使用方向高斯核函数k<sub>o</sub>(·)计算不同像素点之间的角度相似度:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>k</mi><mi>o</mi></msub><mrow><mo>(</mo><msub><mover><mi>&theta;</mi><mo>&RightArrow;</mo></mover><mi>z</mi></msub><mo>,</mo><msub><mover><mi>&theta;</mi><mo>&RightArrow;</mo></mover><mi>s</mi></msub><mo>)</mo></mrow><mo>=</mo><mi>exp</mi><mrow><mo>(</mo><mo>-</mo><msub><mi>&gamma;</mi><mn>0</mn></msub><mo>|</mo><mo>|</mo><msub><mover><mi>&theta;</mi><mo>&RightArrow;</mo></mover><mi>z</mi></msub><mo>-</mo><msub><mover><mi>&theta;</mi><mo>&RightArrow;</mo></mover><mi>s</mi></msub><mo>|</mo><msup><mo>|</mo><mn>2</mn></msup><mo>)</mo></mrow><mo>,</mo></mrow>]]></math><img file="FDA0000752603210000011.GIF" wi="641" he="113" /></maths>其中,γ<sub>0</sub>为方向高斯核参数,<img file="FDA0000752603210000012.GIF" wi="58" he="85" />为图像块中像素点z的方向角,<img file="FDA0000752603210000013.GIF" wi="54" he="82" />为图像块中像素点s的方向角,exp(·)表示求自然对数的指数函数,||·||<sup>2</sup>表示求二范数;2d)对图像块中的方向核函数进行取样,得到一组方向偏置向量<img file="FDA0000752603210000014.GIF" wi="154" he="97" />其中,p<sub>i</sub>为第i个方向偏置向量,d<sub>o</sub>为方向偏置向量的总数,i∈[1,d<sub>o</sub>],则得到方向偏置基向量的高斯核函数:<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><msub><mi>k</mi><mi>o</mi></msub><mrow><mo>(</mo><msub><mover><mi>&theta;</mi><mo>&RightArrow;</mo></mover><mi>z</mi></msub><mo>,</mo><msub><mi>p</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>=</mo><mi>exp</mi><mrow><mo>(</mo><mo>-</mo><msub><mi>&gamma;</mi><mn>0</mn></msub><mo>|</mo><mo>|</mo><msub><mover><mi>&theta;</mi><mo>&RightArrow;</mo></mover><mi>z</mi></msub><mo>-</mo><msub><mi>p</mi><mi>i</mi></msub><mo>|</mo><msup><mo>|</mo><mn>2</mn></msup><mo>)</mo></mrow><mo>,</mo></mrow>]]></math><img file="FDA0000752603210000015.GIF" wi="648" he="109" /></maths>其中,γ<sub>0</sub>为方向高斯核参数,<img file="FDA0000752603210000016.GIF" wi="54" he="92" />为图像块中像素点z的方向角,p<sub>i</sub>为第i个方向偏置基向量;2e)使用位置高斯核函数k<sub>l</sub>(·)计算不同像素点之间的相似度:k<sub>l</sub>(L<sub>z</sub>,L<sub>s</sub>)=exp(‑γ<sub>l</sub>||L<sub>z</sub>‑L<sub>s</sub>||<sup>2</sup>),其中,γ<sub>l</sub>为位置高斯核参数,L<sub>z</sub>为图像块中像素点z的位置、L<sub>s</sub>为图像块中像素s的位置;2f)对图像块中的位置核函数进行取样,得到一组位置偏置基向量<img file="FDA0000752603210000021.GIF" wi="172" he="110" />其中,q<sub>j</sub>为第j个位置偏置向量,d<sub>l</sub>为位置偏置基向量的总数,j∈[1,d<sub>l</sub>];2g)根据偏置基向量<img file="FDA0000752603210000022.GIF" wi="171" he="112" />和位置高斯核函数k<sub>l</sub>(L<sub>z</sub>,L<sub>s</sub>),得到位置偏置基向量的高斯核函数:k<sub>l</sub>(L<sub>z</sub>,q<sub>j</sub>)=exp(‑γ<sub>l</sub>||L<sub>z</sub>‑q<sub>j</sub>||<sup>2</sup>),其中,γ<sub>l</sub>为位置高斯核参数,L<sub>z</sub>为图像块中像素点z的位置,q<sub>j</sub>为第j个位置偏置基向量;2h)根据像素点z的模值<img file="FDA0000752603210000023.GIF" wi="88" he="75" />方向偏置基向量的高斯核函数<img file="FDA0000752603210000024.GIF" wi="221" he="85" />以及位置偏置基向量的高斯核函数k<sub>l</sub>(L<sub>z</sub>,q<sub>j</sub>),得到整个图像集U的核图像特征x(U):<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><mi>x</mi><mrow><mo>(</mo><mi>U</mi><mo>)</mo></mrow><mo>=</mo><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>d</mi><mi>o</mi></msub></munderover><munderover><mo>&Sigma;</mo><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>d</mi><mi>l</mi></msub></munderover><msub><mi>&alpha;</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>{</mo><munder><mo>&Sigma;</mo><mrow><mi>z</mi><mo>&Element;</mo><mi>U</mi></mrow></munder><msub><mover><mi>m</mi><mo>&RightArrow;</mo></mover><mi>z</mi></msub><msub><mi>k</mi><mi>o</mi></msub><mrow><mo>(</mo><msub><mover><mi>&theta;</mi><mo>&RightArrow;</mo></mover><mi>z</mi></msub><mo>,</mo><msub><mi>p</mi><mi>i</mi></msub><mo>)</mo></mrow><msub><mi>k</mi><mi>l</mi></msub><mrow><mo>(</mo><msub><mi>L</mi><mi>z</mi></msub><mo>,</mo><msub><mi>q</mi><mi>j</mi></msub><mo>)</mo></mrow><mo>}</mo><mo>,</mo></mrow>]]></math><img file="FDA0000752603210000025.GIF" wi="903" he="166" /></maths>其中,∑·表示求和,α<sub>ij</sub>为核投影系数,d<sub>l</sub>为位置偏置向量的总数,d<sub>o</sub>为方向偏置向量的总数,z为图像中的像素点,<img file="FDA0000752603210000026.GIF" wi="56" he="83" />为像素点z的方向,<img file="FDA0000752603210000027.GIF" wi="70" he="70" />为像素点z的模值,p<sub>i</sub>为第i个方向偏置向量,q<sub>j</sub>为第j个位置偏置向量,L<sub>z</sub>为图像块中像素点z的位置;(3)使用块匹配方法提取训练视频图像的深度信息D;(4)将深度信息D与核图像特征x(U)相加,得到深度核信息图像特征X;X=D+x(U);(5)使用深度核信息图像特征X进行人体运动姿势的跟踪,对输入视频图像进行三维运动姿势估计,并将估计到的三维运动姿势数据恢复成关节点骨架作为最终的跟踪结果。
地址 710071 陕西省西安市太白南路2号