一种基于环形区域最大频繁视觉单词的图像分类方法,申请号CN201510145940.4-传众专利搜索

发明名称	一种基于环形区域最大频繁视觉单词的图像分类方法
摘要	本发明公开了一种基于环形区域最大频繁视觉单词的图像分类方法，主要解决现有分类模型不能充分表达图像所属类别共有特征以及分类精确度较低的问题。该方法实现步骤是：(1)建立自然场景图像的训练集和测试集；(2)对训练集图像提取SIFT特征点并优化；(3)利用均值聚类方法聚类优化后的特征点集得到视觉词典；(4)基于环形区域提取视觉单词最大频繁项集；(5)生成加权视觉单词直方图；(6)训练支持向量机实现自然场景图像的分类。本发明相较其他利用视觉词袋特征进行图像分类的方法，能够提高同类别图像视觉词袋的相似程度，而使不同类别的差异更显著，在一定程度上提高分类的精确度，具有较强的实用价值。
申请公布号	CN104778475A	申请公布日期	2015.07.15
申请号	CN201510145940.4	申请日期	2015.03.30
申请人	南京邮电大学	发明人	朱书眉;王诚
分类号	G06K9/62(2006.01)I	主分类号	G06K9/62(2006.01)I
代理机构	南京经纬专利商标代理有限公司 32200	代理人	许方
主权项	一种基于环形区域最大频繁视觉单词的图像分类方法，其特征在于包括以下主要步骤：(1)将图像集划分为训练图像集和测试图像集；(2)提取训练图像集的SIFT特征点并优化：(2a)提取图像的SIFT特征点；(2b)令μ＝(x,y)\|(x,y)，计算特征点集合的质心<img file="FDA0000690187600000011.GIF" wi="234" he="74" />其中<img file="FDA0000690187600000012.GIF" wi="337" he="99" /><maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mover><mi>y</mi><mo>&OverBar;</mo></mover><mo>=</mo><mrow><mo>(</mo><mn>1</mn><mo>/</mo><mo>\|</mo><mi>μ</mi><mo>\|</mo><mo>)</mo></mrow><mi>Σy</mi><mo>,</mo></mrow>]]></math><img file="FDA0000690187600000013.GIF" wi="344" he="91" /></maths>其中μ是特征点集；(2c)计算各特征点到质心的距离并将其从小到大依次排列，分别为r<sub>1</sub>,r<sub>2</sub>,…r<sub>k</sub>，k表示特征点个数，选取最后m个值r<sub>k‑m+1</sub>,r<sub>k‑m+2</sub>…r<sub>k</sub>，若出现i个特征点距离相同，则该距离值记录i次，使距离值与特征点一一对应；(2d)令Δr<sub>i</sub>＝r<sub>k‑m+i</sub>+r<sub>k‑m+i‑1</sub>,i∈[1,m]，依次计算Δr<sub>1</sub>/r<sub>k</sub>,Δr<sub>2</sub>/r<sub>k</sub>,……Δr<sub>m</sub>/r<sub>k</sub>的值，若Δr<sub>i</sub>/r<sub>k</sub>>阈值p，将距离d≥r<sub>k‑m+i</sub>的特征点删除；(3)利用均值聚类方法聚类优化后的特征点集，得到视觉词典D，聚类后得到的每一个聚类中心作为一个视觉单词，计算训练图像中SIFT特征点与视觉单词的欧式距离，将特征向量分配到距离最近的视觉单词；(4)对于任意一幅训练图像，以其计算的特征点质心为圆心，划分为n个同心圆环，优化后的特征点集分布在各圆环中，对于不同种类的图像，采用挖掘最大频繁项集方法得到各环内出现的最大频繁视觉单词项集；(5)对最大频繁视觉单词项集加权处理并得到图像视觉单词直方图：(5a)将图像I{I<sub>1</sub>,I<sub>2</sub>…I<sub>N</sub>}n个环的频繁项集记为A<sub>1</sub>,A<sub>2</sub>…A<sub>n</sub>，设I<sub>i</sub>(1)代表图像I<sub>i</sub>的环1，若A<sub>1</sub>中存在I<sub>i</sub>(1)支持的最大频繁项集X<sub>1</sub>，计算I<sub>i</sub>直方图时将X<sub>1</sub>中出现的各视觉单词加权；(5b)设环1内有k<sub>1</sub>个特征点，整幅图像有k个特征点，权值为w<sub>1</sub>＝(1+k<sub>1</sub>/k)；(5c)根据环内实际出现的k<sub>1</sub>个视觉单词结合其权值进行统计，分别对n个环进行处理，最后得到图像I<sub>i</sub>的视觉单词直方图并对其归一化处理；(6)针对图像分类中单特征多类别的分类问题，采用一对多规则，分别训练一组SVM分类器，对应图像库的多个类别，利用训练后的SVM分类器进行测试图像的图像分类。
地址	210003 江苏省南京市新模范马路66号