发明名称 基于潜在狄利克雷分配的自然图像分类方法
摘要 本发明公开了一种基于潜在狄利克雷分配的自然图像分类方法,主要解决现有全监督自然图像分类方法分类时间较长以及在缩短了分类时间的前提下分类精度下降的问题。其实现步骤为:获取每幅自然图像的色调、饱和度、亮度、显著特征图;对所述特征图分别进行网格稠密采样,得到其网格采样点;对每一个网格采样点提取其周围区域的SIFT特征;对同类特征图的SIFT特征进行K聚类,生成视觉词典;用视觉词典将所有特征图量化为视觉文档;将视觉文档顺次相连后输入给LDA模型得到潜在语义主题分布;将所有自然图像的潜在语义主题分布输入给SVM分类器进行分类,得到分类结果。本发明与经典分类方法相比,在缩短了平均分类时间的同时提高了分类精度,可用于目标识别。
申请公布号 CN103366175A 申请公布日期 2013.10.23
申请号 CN201310296468.5 申请日期 2013.07.14
申请人 西安电子科技大学 发明人 焦李成;马文萍;韩冰;王爽;马晶晶;侯彪;白静;田小林
分类号 G06K9/46(2006.01)I;G06F17/30(2006.01)I 主分类号 G06K9/46(2006.01)I
代理机构 陕西电子工业专利中心 61205 代理人 王品华;朱红星
主权项 一种基于潜在狄利克雷分配的自然图像分类方法,包括如下步骤:(1)将每一幅自然图像的彩色空间转换为HIS空间,得到其色调H、饱和度S和亮度I特征图,通过谱残差的方法获取自然图像的显著S特征图;(2)采用网格分块方法分别对每幅自然图像的色调特征图、饱和度特征图、亮度特征图和显著特征图分别进行网格稠密采样,得到每一个特征图相应的网格采样点;(3)对每一个网格采样点提取其周围区域的尺度不变特征转换SIFT特征;(4)对所有自然图像的色调特征图、饱和度特征图、亮度特征图和显著特征图提取出来的SIFT特征分别进行K聚类,即共进行四次K聚类,每次K聚类均生成一个视觉词典和n个聚类中心,每次K聚类生成n个聚类中心对应于一个视觉词典中的n个视觉单词,从而生成四个均由n个视觉单词构成的视觉词典;(5)量化每幅自然图像的色调特征图、亮度特征图、饱和度特征图和显著特征图为视觉文档,并用每幅自然图像的色调特征图、亮度特征图、饱和度特征图和显著特征图中网格采样点的SIFT特征分别与这四幅特征图对应的视觉词典中的每个视觉单词进行比较,找出与每幅自然图像的所有特征图中网格采样点的SIFT特征最相近的视觉单词来代替该SIFT特征,使得每幅自然图像的所有特征图均由n个视觉单词表示,即用量化后每幅自然图像的色调特征图、饱和度特征图、亮度特征图和显著特征图,作为由n个视觉单词构成的视觉文档;(6)将所述视觉文档顺次相连后,输入给潜在狄利克雷分配LDA模型进行若干次Gibbs采样迭代,得到每幅自然图像的潜在语义主题分布;(7)将所有自然图像的潜在语义主题分布输入给支持向量机SVM分类器进行分类,选择所有自然图像的一半的图像作为训练样本,另一半的图像作为测试样本,得到分类结果。
地址 710071 陕西省西安市太白南路2号