发明名称 一种基于分类驱动的可视化词袋特征权重化方法和系统
摘要 本发明公开了一种基于分类驱动的可视化词袋特征权重化方法,包括:从网络下载图像,并建立图像数据库,提取图像数据库中所有N张图像的可视化词袋特征,建立所有N张图像的可视化词袋特征的倒排索引,从图像数据库中随机抽取N1张图像及其对应的可视化词袋特征,通过聚类算法将N1张图像形成C个视觉类,并从每个视觉类中随机选择图像组成该视觉类的学样本集,针对每一视觉类,在该视觉类的学样本集上建立可视化词袋特征的权重学样本集,并利用该权重学样本集训练每个视觉类,以形成该视觉类的支持向量机判别模型。本发明能够解决现有方法中存在的检索精度低、无法挖掘不同查询图像之间差异性的技术问题。
申请公布号 CN103399870A 申请公布日期 2013.11.20
申请号 CN201310285891.5 申请日期 2013.07.08
申请人 华中科技大学 发明人 金海;郑然;朱磊;冯晓文
分类号 G06F17/30(2006.01)I;G06F17/27(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 华中科技大学专利中心 42201 代理人 朱仁玲
主权项 一种基于分类驱动的可视化词袋特征权重化方法,其特征在于,包括以下步骤: (1)从网络下载图像,并建立图像数据库; (2)提取图像数据库中所有N张图像的可视化词袋特征,其中N为任意正整数; (3)建立所有N张图像的可视化词袋特征的倒排索引; (4)从图像数据库中随机抽取N1张图像及其对应的可视化词袋特征,通过聚类算法将N1张图像形成C个视觉类,并从每个视觉类中随机选择图像组成该视觉类的学习样本集,C为正整数; (5)针对每一视觉类,在该视觉类的学习样本集上建立可视化词袋特征的权重学习样本集,并利用该权重学习样本集训练每个视觉类,以形成该视觉类的支持向量机判别模型; (6)采用最大分类器分值原则,利用获得的支持向量机判别模型提取图像数据库中每张图像的视觉类,该视觉类为该图像的潜在类别标号,并建立每张图像的序号与该图像的潜在类别标号之间的映射关系表; (7)根据可视化词袋特征的权重学习样本集计算C个视觉类中每一个视觉类的可视词权重,并建立视觉类与该视觉类的可视词权重之间的映射关系表; (8)提取查询图像的可视化词袋特征,输入支持向量机判别模型,得到查询图像的视觉类; (9)根据查询图像的视觉类与可视词权重的映射关系表,得到该查询图像可视化词袋特征中可视词的权重,输入倒排索引文件,计算查询图像与图像数据库中所有图像之间的距离; (10)将步骤(9)中得到的距离从小到大排序,并返回给检索用户每 一个距离所对应的图像数据库中的图像,以获得检索结果; (11)判断检索结果是否满足检索用户需求,若检索用户对检索结果不满意,在检索结果中选择L张视觉感官上与查询图像相同的图像进行正反馈,调整可视词的权重,输入倒排索引,得到重排序结果;若检索用户对检索结果满意,则直接返回检索结果。
地址 430074 湖北省武汉市洪山区珞喻路1037号