发明名称 二维视频图像中的人体姿态识别方法
摘要 本发明公开了一种二维视频图像中的人体姿态识别方法,包括下述步骤:将原始视频图像<img file="2014107348453100004dest_path_image002.GIF" wi="6" he="11" />按照尺度大小进行分组;对每组图像计算一个指定尺度的采样图像,并对该采样图像计算HOG;以每组内的一个采样图像的HOG预测计算组内其它指定尺度采样图像对应的HOG;根据所得的多尺度HOG,结合训练好的SVM分类器检测所述原始视频图像<img file="511883dest_path_image002.GIF" wi="6" he="11" />中不同尺度下的人体目标区域;采用训练好的随机森林分类器将检测的人体目标区域的像素进行分类,确定所述人体目标区域中的肢体部位区域;将各肢体部位连接形成人体轮廓,实现人体姿态识别。应用本发明的方法,在不降低检测精度的基础上,加速了多尺度底层特征的计算速度,提高了姿态识别速度和精度。
申请公布号 CN104392223A 申请公布日期 2015.03.04
申请号 CN201410734845.3 申请日期 2014.12.05
申请人 青岛科技大学 发明人 王传旭;刘云;闫春娟;崔雪红;李辉
分类号 G06K9/00(2006.01)I;G06K9/46(2006.01)I;G06K9/62(2006.01)I;G06K9/66(2006.01)I 主分类号 G06K9/00(2006.01)I
代理机构 青岛联智专利商标事务所有限公司 37101 代理人 李升娟
主权项 一种二维视频图像中的人体姿态识别方法,其特征在于,所述方法包括下述步骤:a、按照尺度空间分层原理将原始视频图像<img file="2014107348453100001dest_path_image001.GIF" wi="14" he="18" />分为<img file="130370dest_path_image002.GIF" wi="17" he="20" />组,<img file="2014107348453100001dest_path_image003.GIF" wi="172" he="25" />,<img file="391587dest_path_image004.GIF" wi="52" he="22" />为所述原始视频图像的分辨率;b、对每组视频图像采样,计算一个尺度为<img file="2014107348453100001dest_path_image005.GIF" wi="16" he="20" />的采样图像<img file="857203dest_path_image006.GIF" wi="81" he="25" />,<img file="178463dest_path_image005.GIF" wi="16" he="20" />为<img file="dest_path_image007.GIF" wi="168" he="25" />中的其中一个尺度,<img file="dest_path_image009.GIF" wi="9" he="18" />表示第<img file="57426dest_path_image009.GIF" wi="9" he="18" />组视频图像,<img file="794438dest_path_image010.GIF" wi="78" he="22" />,<img file="dest_path_image011.GIF" wi="80" he="22" />为所述原始视频图像的分辨率,一般地,<img file="380140dest_path_image012.GIF" wi="14" he="16" />为设定的大于1的自然数,表示每组视频图像包含的采样视频图像的数量,<img file="dest_path_image013.GIF" wi="50" he="22" />;c、对每组内的采样图像<img file="937548dest_path_image006.GIF" wi="81" he="25" />分别计算HOG底层特征描述符<img file="913594dest_path_image014.GIF" wi="49" he="25" />;d、以步骤c获得的每组内的一个采样图像的HOG底层特征描述符为基础,根据预测公式<img file="dest_path_image015.GIF" wi="194" he="26" />计算每组内尺度为<img file="516614dest_path_image007.GIF" wi="168" he="25" />中其余(<img file="222402dest_path_image016.GIF" wi="33" he="20" />)个尺度的采样视频图像对应的HOG底层特征描述符,<img file="dest_path_image017.GIF" wi="18" he="25" />和<img file="619885dest_path_image018.GIF" wi="20" he="25" />分别表示采样图像<img file="dest_path_image019.GIF" wi="22" he="25" />和采样图像<img file="473440dest_path_image020.GIF" wi="24" he="25" />的尺度,<img file="dest_path_image021.GIF" wi="22" he="25" />为设定值,<img file="614572dest_path_image022.GIF" wi="52" he="25" />为采样图像<img file="112549dest_path_image019.GIF" wi="22" he="25" />的HOG底层特征描述符,<img file="dest_path_image023.GIF" wi="54" he="25" />为采样图像<img file="683864dest_path_image020.GIF" wi="24" he="25" />的HOG底层特征描述符;e、根据步骤c和步骤d的所有不同尺度采样视频图像的HOG底层特征描述符,结合训练好的SVM,检测所述原始视频图像中的不同尺度下的人体目标区域;f、采用训练好的随机森林分类器将步骤e检测的人体目标区域的像素进行分类,确定所述人体目标区域中的肢体部位区域;g、将步骤f确定的各肢体部位连接形成人体轮廓,实现人体姿态识别。
地址 266061 山东省青岛市松岭路99号青岛科技大学信息学院