主权项 |
一种基于由不同大小视觉词汇本构成的视觉词汇本集体的图像分类方法,其特征在于利用多分辨率信息来量化图像,来自于不同综合层的多种可用线索并行用来分类图像,为了利用不同粒度的信息来分类图像,图像在基于不同大小的视觉词汇本上量化,这些不同大小的视觉词汇本可以捕获不同的图像特征,包括如下步骤:输入训练图像集,在所述训练图像集上用兴趣点检测子提取训练图像的兴趣点,然后用描述子描述提取出来的兴趣点,得到所述训练图像集的描述特征集;在所述训练图像描述特征集上随机选择18个子集,在其上分别运行设置了如下18个不同簇个数的聚类算法:200,400,800,1200,1300,1500,1600,1700,1900,2000,2200,2600,2800,3000,3600,4000,4500,和5000,从而得到18个大小分别如所述簇个数大小的成员视觉词汇本;将所述训练图像集,分别基于所述18个不同大小的成员视觉词汇本上进行直方图量化,得到18个训练图像量化特征集,表达了所述训练图像集不同粒度信息;在所述18个训练图像量化特征集上分别进行分类器训练,学习得到18个分类器,利用来自于不同综合层的多种可用线索进行识别;输入待分类图像,在提取并描述兴趣点后,利用所述18个视觉词汇本分别进行量化,得到18个表达了不同分辨率信息的量化特征;将所述待分类图像的18个量化特征分别输入所述学习得到的18个利用不同综合层的多种可用线索进行识别的分类器,得到所述待分类图像的18个分类结果;将所述18个待分类图像的分类结果进行集成,得到所述待分类图像的最终分类结果。 |