发明名称 一种面向智能视频监控的监控场景类型辨识方法
摘要 本发明的一种面向智能视频监控的监控场景类型辨识方法。它包括以下步骤:创建一个监控场景图像样本集;对监控场景图像样本集进行预处理;根据预处理后的监控场景图像样本集,建立相应的多尺度图像金字塔集合;利用多尺度图像金字塔集合,产生一个视觉词汇库;利用视觉词汇库,对监控场景图像样本集中的所有图像进行特征值提取;构建三个监控场景类型辨识器;对监控场景图像样本集之外的任意一幅场景类型未知的监控场景图像,进行监控场景类型辨识。本发明能够有效克服视频监控场景图像中普遍存在的尺度变化、视角变化和物体遮挡等问题,提高了辨识正确率。
申请公布号 CN104616026A 申请公布日期 2015.05.13
申请号 CN201510028427.7 申请日期 2015.01.20
申请人 衢州学院 发明人 张睿;童玉娟;周兆忠;张元祥
分类号 G06K9/64(2006.01)I;H04N7/18(2006.01)I 主分类号 G06K9/64(2006.01)I
代理机构 杭州杭诚专利事务所有限公司 33109 代理人 尉伟敏
主权项 一种面向智能视频监控的监控场景类型辨识方法,其特征在于,包括以下步骤:S1:创建监控场景图像样本集{I<sub>1</sub>,I<sub>2</sub>,…,I<sub>N</sub>},N是自然数;S2:对监控场景图像样本集{I<sub>1</sub>,I<sub>2</sub>,…,I<sub>N</sub>}进行预处理;S3:由预处理后的监控场景图像样本集{G<sub>1</sub>,G<sub>2</sub>,…,G<sub>N</sub>},建立其对应的三层多尺度图像金字塔集合{P<sub>1</sub>,P<sub>2</sub>,…,P<sub>N</sub>};S4:利用三层多尺度图像金字塔集合{P<sub>1</sub>,P<sub>2</sub>,…,P<sub>N</sub>},产生一个视觉词汇库{W<sub>1</sub>,W<sub>2</sub>,…,W<sub>K</sub>},包括以下步骤:S41:对三层多尺度图像金字塔集合{P<sub>1</sub>,P<sub>2</sub>,…,P<sub>N</sub>}中的任一幅三层多尺度图像金字塔P<sub>k</sub>,用均匀网格采样法在三层多尺度图像金字塔P<sub>k</sub>的每一层图像上选取三层多尺度图像金字塔P<sub>k</sub>的特征点,然后使用SIFT方法提取其对应的SIFT特征向量;S42:用步骤S41的方法对三层多尺度图像金字塔集合{P<sub>1</sub>,P<sub>2</sub>,…,P<sub>N</sub>}中的所有三层多尺度金字塔图像进行处理,提取所有三层多尺度金字塔图像对应的SIFT特征向量;S43:对提取的全部SIFT特征向量进行K均值聚类,将每个聚类中心作为一个视觉词汇,则由K个聚类中心组成一个视觉词汇库{W<sub>1</sub>,W<sub>2</sub>,…,W<sub>K</sub>};S5:求取监控场景图像样本集{G<sub>1</sub>,G<sub>2</sub>,…,G<sub>N</sub>}中的每一幅监控场景图像对应的特征值,建立一个特征值矩阵F和一个对应的类型标号矩阵C,包括以下步骤:S51:在监控场景图像样本集{G<sub>1</sub>,G<sub>2</sub>,…,G<sub>N</sub>}中的任一幅监控场景图像G<sub>k</sub>的三层多尺度图像金字塔P<sub>k</sub>的三个不同尺度层次上,分别用空间金字塔方法构建出三个不同尺度的三层空间金字塔;S52:利用视觉词汇库{W<sub>1</sub>,W<sub>2</sub>,…,W<sub>K</sub>},在三层多尺度图像金字塔P<sub>k</sub>构建出的三个三层空间金字塔上统计视觉词汇出现的类型及个数,建立相应的统计直方图,得到一个与监控场景图像G<sub>k</sub>对应的视觉词汇统计直方图向量{H<sub>k1</sub>,H<sub>k2</sub>,H<sub>k3</sub>};S53:对监控场景图像样本集{G<sub>1</sub>,G<sub>2</sub>,…,G<sub>N</sub>}中所有图像均进行步骤S51至步骤S52的处理,则监控场景图像样本集{G<sub>1</sub>,G<sub>2</sub>,…,G<sub>N</sub>}中的每一幅监控场景图像都对应产生一个视觉词汇统计直方图向量;S54:对监控场景图像样本集{G<sub>1</sub>,G<sub>2</sub>,…,G<sub>N</sub>}中的任一幅监控场景图像G<sub>k</sub>,利用该监控场景图像G<sub>k</sub>对应的视觉词汇统计直方图向量和监控场景图像样本集{G<sub>1</sub>,G<sub>2</sub>,…,G<sub>N</sub>}中每幅监控场景图像对应的视觉词汇统计直方图向量,计算出监控场景图像G<sub>k</sub>与监控场景图像样本集{G<sub>1</sub>,G<sub>2</sub>,…,G<sub>N</sub>}中每幅图像的交叉核,得到监控场景图像G<sub>k</sub>所对应的交叉核向量{X<sub>k1</sub>,X<sub>k2</sub>,…,X<sub>kN</sub>},将该交叉核向量{X<sub>k1</sub>,X<sub>k2</sub>,…,X<sub>kN</sub>}作为监控场景图像G<sub>k</sub>的特征值;S55:建立一个特征值矩阵F和一个对应的类型标号矩阵C,将监控场景图像G<sub>k</sub>对应的特征值和监控场景图像G<sub>k</sub>所属的类型标号分别存放在特征值矩阵F的第k行和类型标号矩阵C的第k行中;S56:对监控场景图像样本集{G<sub>1</sub>,G<sub>2</sub>,…,G<sub>N</sub>}中所有图像进行步骤S51至S55的处理,则特征值矩阵F中存放着监控场景图像样本集{G<sub>1</sub>,G<sub>2</sub>,…,G<sub>N</sub>}中所有图像的特征值,而类型标号矩阵C中存放着监控场景图像样本集{G<sub>1</sub>,G<sub>2</sub>,…,G<sub>N</sub>}中所有图像的类型标号;S6:利用特征值矩阵F和类型标号矩阵C构建监控场景类型辨识器;S7:对任意一幅场景类型未知的监控场景图像J进行监控场景类型辨识,包括以下方法:S71:对图像J进行预处理;S72:建立与预处理后的图像J对应的三层多尺度图像金字塔P<sub>J</sub>;S73:采用步骤S51至步骤S54对图像J进行处理,得到对应的特征值;S74:将得到的特征值输入监控场景类型辨识器,监控场景类型辨识器查找出该特征值对应的类型标号并输出,该类型标号表明了图像J所应归属的场景类型。
地址 324000 浙江省衢州市柯城区九华北大道78号衢州学院