发明名称 基于广义回归神经网络的多向运动人群流量估计方法
摘要 本发明涉及一种基于广义回归神经网络的多向运动人群流量估计方法。基于线性回归的方法难以应对行人间遮挡严重、人群分割质量较差时的复杂情况。本发明首先通过光流场提取运动人群的动态纹理特征,然后借助动态纹理特征和水平集算法实现人群的按运动方向分割,获得代表不同运动方向的ROI,再利用GRNN实现ROI特征与人群流量之间的回归分析,从而获取场景中具有不同运动方向人群的精确、实时流量统计结果。本发明不仅可以回避复杂的行人个体特征的提取与跟踪过程,大幅提升算法的抗行人间遮挡能力,同时也可兼顾行人运动的整体性与差异性,从而实现人群的按运动方向分割。
申请公布号 CN102609688A 申请公布日期 2012.07.25
申请号 CN201210023435.9 申请日期 2012.02.02
申请人 杭州电子科技大学 发明人 于海滨;何志伟;周巧娣;刘圆圆
分类号 G06K9/00(2006.01)I 主分类号 G06K9/00(2006.01)I
代理机构 杭州求是专利事务所有限公司 33200 代理人 杜军
主权项 1.基于广义回归神经网络的多向运动人群流量估计方法,其特征该方法包括以下步骤;步骤1.基于光流场的动态纹理特征提取;步骤2.基于动态纹理和水平集算法的多向运动人群分割;步骤3.基于GRNN的人群流量回归估计;所述的基于光流场的动态纹理特征提取步骤包括以下过程:(1)光流场计算:采用Brox多分辨率光流估计算法获得人群视频中连续两帧图像的光流场<img file="2012100234359100001DEST_PATH_IMAGE002.GIF" wi="68" he="25" />,其中<img file="2012100234359100001DEST_PATH_IMAGE004.GIF" wi="17" he="18" />表示光流场强度,<img file="2012100234359100001DEST_PATH_IMAGE006.GIF" wi="16" he="18" />表示光流场的方向角;(2)光流场强度的透视归一化:采用透视四边形法实现光流场中任意一点的光流场强度<img file="565132DEST_PATH_IMAGE004.GIF" wi="17" he="18" />的归一化,获得归一化光流场<img file="2012100234359100001DEST_PATH_IMAGE008.GIF" wi="36" he="26" />,该归一化光流场<img file="424504DEST_PATH_IMAGE008.GIF" wi="36" he="26" />即为动态纹理特征;所述的基于动态纹理和水平集算法的多向运动人群分割步骤包括以下过程:(1)方向角区间划分:根据人群运动方向的先验知识将光流场的方向角<img file="594192DEST_PATH_IMAGE006.GIF" wi="16" he="18" />划分为<img file="2012100234359100001DEST_PATH_IMAGE010.GIF" wi="14" he="16" />个互不相交的方向角区间<img file="2012100234359100001DEST_PATH_IMAGE012.GIF" wi="22" he="25" />,其中<img file="2012100234359100001DEST_PATH_IMAGE014.GIF" wi="80" he="22" />;(2)具有不同方向角区间的子光流场获取:逐点扫描归一化光流场<img file="954635DEST_PATH_IMAGE008.GIF" wi="36" he="26" />中的每一点,根据其方向角<img file="965316DEST_PATH_IMAGE006.GIF" wi="16" he="18" />将其归入相应的方向角区间<img file="497054DEST_PATH_IMAGE012.GIF" wi="22" he="25" />,扫描完成后,<img file="593186DEST_PATH_IMAGE008.GIF" wi="36" he="26" />被分解为<img file="101527DEST_PATH_IMAGE010.GIF" wi="14" he="16" />个具有不同方向角区间的子光流场<img file="2012100234359100001DEST_PATH_IMAGE016.GIF" wi="36" he="26" />;(3)子光流场分割:在每一个子光流场<img file="232294DEST_PATH_IMAGE016.GIF" wi="36" he="26" />中,借助Renyi熵阈值法实现光流场强度<img file="2012100234359100001DEST_PATH_IMAGE018.GIF" wi="36" he="26" />的分割,以获得子光流场运动人群的分割结果<img file="2012100234359100001DEST_PATH_IMAGE020.GIF" wi="17" he="25" />;(4)初始分割结果获取:合并<img file="495786DEST_PATH_IMAGE020.GIF" wi="17" he="25" />,并依据所对应的方向角区间的不同进行区分标记,从而获得具有不同运动方向的人群的初始分割结果<img file="DEST_PATH_IMAGE022.GIF" wi="16" he="20" />;(5)ROI集合获取:采用无需对水平集函数重新初始化的变分水平集算法,优化初始分割结果<img file="657644DEST_PATH_IMAGE022.GIF" wi="16" he="20" />,获取对应不同运动方向的人群的ROI集合,即<img file="DEST_PATH_IMAGE024.GIF" wi="262" he="22" />,其中,<img file="DEST_PATH_IMAGE026.GIF" wi="33" he="22" />为隶属于相同方向角区间<img file="969676DEST_PATH_IMAGE012.GIF" wi="22" he="25" />的ROI的数目;所述的基于GRNN的人群流量回归估计步骤包括以下过程:(1)ROI特征提取:获取与人群流量密切相关的ROI面积、ROI周长、ROI周长面积比、ROI内部边缘点数目、ROI分形维度以及ROI的统计地形特征,用于人群流量的回归分析;(2)用于网络训练的样本集的获取:选取场景中具有不同人群密度和遮挡程度的多个代表性ROI,作为网络训练的样本集;(3)GRNN模型的建立和训练:以ROI面积、ROI周长、ROI周长面积比、ROI内部边缘点数目、ROI分形维度以及ROI的统计地形特征作为网络输入,以ROI中的行人数目作为网络输出,构建GRNN,同时,给定输出误差限,采取样本集的交叉验证方法训练GRNN网络,并用循环比较方式获取最优SPREAD值;所述的ROI的统计地形特征包括与可变水平面<img file="DEST_PATH_IMAGE028.GIF" wi="41" he="16" />相关的山峰实体个数<img file="DEST_PATH_IMAGE030.GIF" wi="21" he="26" />的统计均值<img file="DEST_PATH_IMAGE032.GIF" wi="45" he="26" />和方差<img file="DEST_PATH_IMAGE034.GIF" wi="46" he="26" />,山谷实体个数<img file="DEST_PATH_IMAGE036.GIF" wi="21" he="26" />的统计均值<img file="DEST_PATH_IMAGE038.GIF" wi="45" he="26" />和方差<img file="DEST_PATH_IMAGE040.GIF" wi="46" he="26" />;(4)人群流量估计器的获取:完成训练的GRNN即可作为单个ROI中人群流量值的估计器,该人群流量估计器的输入为ROI特征,输出为该ROI中的行人数目;(5)人群流量估计结果的输出:提取ROI集合中每一个ROI的特征,依次输入人群流量估计器,获得每一个ROI中的人群流量估计结果,再将隶属于相同方向角区间的ROI的人群流量估计结果合并,从而获取每个方向角区间内的人群流量估计结果,并依据不同的方向角区间进行输出,完成具有不同运动方向的人群的流量估计。
地址 310018 浙江省杭州市下沙高教园区2号大街