发明名称 基于级联式码本生成的图像分类方法
摘要 本发明为一种基于级联式码本生成的图像分类方法,该方法采用级联式的码本生成方式,根据训练样本的变化,动态地调整样本映射空间,使得训练样本更容易被分开,进而训练基于当前码本的分类器。测试图像依次通过训练好的每一个分类器,如果所有分类器输出为正,图像类别标签判别为正,否则,图像类别标签判别为负。该方法采用级联式的码本生成方法,使得每一轮的码本在保持较强的判别性的同时,降低了图像表示的维数,解决了码本多样性与维数灾难之间的矛盾;同时,本方法采用级联式的码本生成方式,使得每一轮训练正负样本数目相同,巧妙的解决了特定类别分类中常见的样本不均衡问题,具有重要的应用价值。
申请公布号 CN102156885B 申请公布日期 2014.03.26
申请号 CN201010112508.2 申请日期 2010.02.12
申请人 中国科学院自动化研究所 发明人 张琳波;肖柏华;王春恒;张荣国;蔡新元
分类号 G06K9/66(2006.01)I 主分类号 G06K9/66(2006.01)I
代理机构 中科专利商标代理有限责任公司 11021 代理人 梁爱荣
主权项 一种基于级联式码本生成的图像分类方法,其特征在于,该图像分类方法包括步骤如下:步骤S1:对图像数据集进行预处理是利用局部显著区域检测子,检测图像数据集所有图像中的局部显著区域,并用向量表示,将所有图像表示成为局部显著区域图像块的集合;步骤S2:采用级联的方式对局部显著区域图像块的集合进行处理,生成码本、将训练图像向量化并训练分类器;步骤S3:采用级联的方式使得每一幅测试图像依次经过所有训练好的分类器,在经过每一个训练好的分类器的时候,将测试图像在当前训练好的分类器对应的码本上面按照与训练图像相同的方式,生成直方图向量,输入分类器;若分类结果小于阈值T2,则图像标签为负,测试结束;否则,测试图像进入下一个训练好的分类器;只有当测试图像在所有训练好的分类器上面标签都为正,测试图像被标注为正图像;步骤S2所述生成码本、将训练图像向量化并训练分类器的具体步骤如下:步骤S21:将局部显著区域图像块的集合中所有由正的训练图像经图像预处理得到的局部显著区域图像块利用k‑均值聚类,生成k个聚类中心作为正码本;步骤S22:从当前所有训练图像的负训练图像中,随机选择与正训练图像相同数目的图像,构成采样得到的负训练图像;步骤S23:将局部显著区域图像块集合中所有由采样得到的负训练图像经图像预处理得到的局部显著区域图像块利用k‑均值聚类,生成k个聚类中心作为负码本;步骤S24:将正码本与负码本融合,得到2k个聚类中心,作为本轮的码本;步骤S25:将当前所有训练图像中的每一块局部显著区域图像块按照最近邻的法则,映射到本轮的码本上,即将本轮的码本中与每个局部显著区域图像块最近的聚类中心作为该局部显著区域图像块的代表;统计本轮 的码本中每一个聚类中心在当前所有训练图像中的每一幅图像中出现的次数,形成本轮的码本中每个聚类中心在每一幅图像中出现次数的直方图向量,作为每一幅图像在本轮的码本上的表示向量;步骤S26:选择正训练图像和采样得到的负训练图像对应的直方图向量分别作为正负样本训练本轮的分类器,将本轮的码本和训练得到的本轮的分类器之间建立对应关系,保存在分类器文件夹中;步骤S27:将当前所有的负训练图像对应的直方图向量输入本轮的分类器,如果分类器输出大于阈值T1,则负训练图像被错误分类;如果被误分类的负训练图像个数小于正训练图像的个数,则训练过程终止;否则,将分类错误的负训练图像作为新的负训练图像与原始的正训练图像构成新的训练图像回到步骤S22开始新的一轮训练。
地址 100080 北京市海淀区中关村东路95号