发明名称 一种基于改进视觉词袋模型的图像分类方法
摘要 本发明涉及一种基于改进视觉词袋模型的图像分类方法,针对场景图像,主要解决复杂背景下,传统分类模型不能充分表达同类图像的共有特征,从而导致分类准确度不高的问题;以及传统分类模型算法复杂度较高,实际运行效率低的问题,本发明相比其他利用视觉词袋模型进行图像分类的方法,能够突出同类图像共有的视觉单词,从而增强同类图像视觉词袋的相似性,在一定程度上提高分类的准确性,且利用Topology模型提高了生成视觉词典的效率,具有较强的实用价值。
申请公布号 CN106250909A 申请公布日期 2016.12.21
申请号 CN201610542277.6 申请日期 2016.07.11
申请人 南京邮电大学 发明人 王诚;陈杰
分类号 G06K9/62(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 南京经纬专利商标代理有限公司 32200 代理人 许方
主权项 一种基于改进视觉词袋模型的图像分类方法,其特征在于:具体包括以下步骤:步骤1,将图像集划分为训练图像集和测试图像集;步骤2,获取训练图像集的SIFT描述子:步骤2.1,利用尺度可变的二维高斯核函数与原始图像做卷积,将相邻尺度的两个高斯图像相减建立DOG尺度空间金字塔模型,具体计算为:L(x,y,σ)=G(x,y,σ)*I(x,y);D(x,y,σ)=(G(x,y,kσ)‑G(x,y,σ))*I(x,y);其中G(x,y,σ)为可变尺度的二维高斯函数,L(x,y,σ)为图像函数的尺度空间,D(x,y,σ)为原始图像;σ为尺度空间因子,是高斯函数的标准差;I(x,y)为图像的二维函数表示,其中x和y是空间坐标,k为常数。步骤2.2,通过逐个比较每个像素点(x,y)的方法,找到相邻位置和相邻尺度内的特征点,并确定特征点的位置和尺度;步骤2.3,计算特征点邻域内每个像素点的梯度幅值和方向,计算公式为:<img file="FDA0001046097670000011.GIF" wi="1244" he="85" /><img file="FDA0001046097670000012.GIF" wi="790" he="145" />其中,m(x,y)代表特征点梯度的大小,θ(x,y)代表特征点的梯度方向;步骤2.4,以特征点为中心,对其邻域分块并计算块内梯度直方图,生成SIFT描述子;步骤3,利用均值聚类方法聚类步骤2.2生成的所有特征点,进而生成视觉词典;步骤4,根据步骤3生成的视觉词典,生成每一幅图像的视觉词袋,进而提取同类图像视觉单词的最大频繁项集;步骤5,对视觉单词的最大频繁项集进行加权处理后生成其视觉单词直方图;步骤6,测试图像集处理过程和训练图像集步骤2到步骤5的处理过程相同, 最后根据生成的视觉单词直方图训练SVM分类器实现场景图像的图像分类。
地址 210023 江苏省南京市栖霞区文苑路9号