主权项 |
一种基于环形区域最大频繁视觉单词的图像分类方法,其特征在于包括以下主要步骤:(1)将图像集划分为训练图像集和测试图像集;(2)提取训练图像集的SIFT特征点并优化:(2a)提取图像的SIFT特征点;(2b)令μ=(x,y)|(x,y),计算特征点集合的质心<img file="FDA0000690187600000011.GIF" wi="234" he="74" />其中<img file="FDA0000690187600000012.GIF" wi="337" he="99" /><maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mover><mi>y</mi><mo>‾</mo></mover><mo>=</mo><mrow><mo>(</mo><mn>1</mn><mo>/</mo><mo>|</mo><mi>μ</mi><mo>|</mo><mo>)</mo></mrow><mi>Σy</mi><mo>,</mo></mrow>]]></math><img file="FDA0000690187600000013.GIF" wi="344" he="91" /></maths>其中μ是特征点集;(2c)计算各特征点到质心的距离并将其从小到大依次排列,分别为r<sub>1</sub>,r<sub>2</sub>,…r<sub>k</sub>,k表示特征点个数,选取最后m个值r<sub>k‑m+1</sub>,r<sub>k‑m+2</sub>…r<sub>k</sub>,若出现i个特征点距离相同,则该距离值记录i次,使距离值与特征点一一对应;(2d)令Δr<sub>i</sub>=r<sub>k‑m+i</sub>+r<sub>k‑m+i‑1</sub>,i∈[1,m],依次计算Δr<sub>1</sub>/r<sub>k</sub>,Δr<sub>2</sub>/r<sub>k</sub>,……Δr<sub>m</sub>/r<sub>k</sub>的值,若Δr<sub>i</sub>/r<sub>k</sub>>阈值p,将距离d≥r<sub>k‑m+i</sub>的特征点删除;(3)利用均值聚类方法聚类优化后的特征点集,得到视觉词典D,聚类后得到的每一个聚类中心作为一个视觉单词,计算训练图像中SIFT特征点与视觉单词的欧式距离,将特征向量分配到距离最近的视觉单词;(4)对于任意一幅训练图像,以其计算的特征点质心为圆心,划分为n个同心圆环,优化后的特征点集分布在各圆环中,对于不同种类的图像,采用挖掘最大频繁项集方法得到各环内出现的最大频繁视觉单词项集;(5)对最大频繁视觉单词项集加权处理并得到图像视觉单词直方图:(5a)将图像I{I<sub>1</sub>,I<sub>2</sub>…I<sub>N</sub>}n个环的频繁项集记为A<sub>1</sub>,A<sub>2</sub>…A<sub>n</sub>,设I<sub>i</sub>(1)代表图像I<sub>i</sub>的环1,若A<sub>1</sub>中存在I<sub>i</sub>(1)支持的最大频繁项集X<sub>1</sub>,计算I<sub>i</sub>直方图时将X<sub>1</sub>中出现的各视觉单词加权;(5b)设环1内有k<sub>1</sub>个特征点,整幅图像有k个特征点,权值为w<sub>1</sub>=(1+k<sub>1</sub>/k);(5c)根据环内实际出现的k<sub>1</sub>个视觉单词结合其权值进行统计,分别对n个环进行处理,最后得到图像I<sub>i</sub>的视觉单词直方图并对其归一化处理;(6)针对图像分类中单特征多类别的分类问题,采用一对多规则,分别训练一组SVM分类器,对应图像库的多个类别,利用训练后的SVM分类器进行测试图像的图像分类。 |