主权项 |
一种结合不同聚类算法生成视觉字典集体的方法,其特征在于为了捕获自然物体类的不同数据结构,不同的聚类算法用来构造视觉字典集体,通过在同一训练图像集的局部视觉描述子集合上运行不同的聚类算法,可以得到视觉字典集体,基于此基础上进行图像识别,包括如下步骤:输入训练图像集,在所述训练图像集上用显著性区域检测子提取训练图像的显著性区域,然后用描述子描述所述显著性区域得到所述训练图像集的描述特征集;在所述训练图像描述特征集上随机选择12个训练图像描述特征子集;在所述12个训练图像描述特征子集上分别运行以下12种不同聚类算法得到12个视觉字典,构成视觉字典集体:Cluto‑rb‑cosine方法,Cluto‑rb‑Correlation方法,k‑means‑Euclidean方法,k‑means‑cityblock方法,k‑means‑consine方法, clusteringby2ndEV方法,标准谱聚类算法,局部尺度适应的谱聚类算法,VL_ikmeans方法,VL‑hiKmeans方法,基于簇特征矢量的分级凝聚k‑means算法1,基于簇特征矢量的分级凝聚k‑means算法2;在所述12个视觉字典基础上,对所述训练图像集分别进行量化,得到所述训练图像集的12个不同的训练图像量化特征集;在所述12个训练图像量化特征集上,分别训练学习得到12个分类器;输入待识别图像,对所述待识别图像提取显著性区域并描述后,分别在所述12个视觉字典上量化,得到所述待识别图像的12个表达矢量;将所述待识别图像的12个表达矢量分别输入所述训练学习得到的12个分类器进行分类得到12个分类结果;将所述12个分类结果进行投票集成得到所述待识别图像的最终识别结果。 |