一种基于改进视觉词袋模型的图像分类方法,申请号CN201610542277.6-传众专利搜索

发明名称	一种基于改进视觉词袋模型的图像分类方法
摘要	本发明涉及一种基于改进视觉词袋模型的图像分类方法，针对场景图像，主要解决复杂背景下，传统分类模型不能充分表达同类图像的共有特征，从而导致分类准确度不高的问题；以及传统分类模型算法复杂度较高，实际运行效率低的问题，本发明相比其他利用视觉词袋模型进行图像分类的方法，能够突出同类图像共有的视觉单词，从而增强同类图像视觉词袋的相似性，在一定程度上提高分类的准确性，且利用Topology模型提高了生成视觉词典的效率，具有较强的实用价值。
申请公布号	CN106250909A	申请公布日期	2016.12.21
申请号	CN201610542277.6	申请日期	2016.07.11
申请人	南京邮电大学	发明人	王诚;陈杰
分类号	G06K9/62(2006.01)I	主分类号	G06K9/62(2006.01)I
代理机构	南京经纬专利商标代理有限公司 32200	代理人	许方
主权项	一种基于改进视觉词袋模型的图像分类方法，其特征在于：具体包括以下步骤：步骤1，将图像集划分为训练图像集和测试图像集；步骤2，获取训练图像集的SIFT描述子：步骤2.1，利用尺度可变的二维高斯核函数与原始图像做卷积，将相邻尺度的两个高斯图像相减建立DOG尺度空间金字塔模型，具体计算为：L(x,y,σ)＝G(x,y,σ)I(x,y)；D(x,y,σ)＝(G(x,y,kσ)‑G(x,y,σ))I(x,y)；其中G(x,y,σ)为可变尺度的二维高斯函数，L(x,y,σ)为图像函数的尺度空间，D(x,y,σ)为原始图像；σ为尺度空间因子，是高斯函数的标准差；I(x,y)为图像的二维函数表示，其中x和y是空间坐标，k为常数。步骤2.2，通过逐个比较每个像素点(x,y)的方法，找到相邻位置和相邻尺度内的特征点，并确定特征点的位置和尺度；步骤2.3，计算特征点邻域内每个像素点的梯度幅值和方向，计算公式为：<img file="FDA0001046097670000011.GIF" wi="1244" he="85" /><img file="FDA0001046097670000012.GIF" wi="790" he="145" />其中，m(x,y)代表特征点梯度的大小，θ(x,y)代表特征点的梯度方向；步骤2.4，以特征点为中心，对其邻域分块并计算块内梯度直方图，生成SIFT描述子；步骤3，利用均值聚类方法聚类步骤2.2生成的所有特征点，进而生成视觉词典；步骤4，根据步骤3生成的视觉词典，生成每一幅图像的视觉词袋，进而提取同类图像视觉单词的最大频繁项集；步骤5，对视觉单词的最大频繁项集进行加权处理后生成其视觉单词直方图；步骤6，测试图像集处理过程和训练图像集步骤2到步骤5的处理过程相同，最后根据生成的视觉单词直方图训练SVM分类器实现场景图像的图像分类。
地址	210023 江苏省南京市栖霞区文苑路9号