发明名称 基于短语包模型的图像类别标注方法
摘要 本发明为一种基于短语包模型的图像类别标注方法,该方法在现有的字包模型表示的基础上,引入视觉字之间的位置信息,提出了短语包模型表示策略。本发明有效的解决了传统字包模型缺乏位置信息导致判别性不足与加入分块的位置信息后对目标位移敏感之间的矛盾;使得图像在引入视觉字之间的位置信息而增加了判别性的同时,消除了对目标在图像中位移的敏感性,有效地提高了图像类别标注系统的性能,具有重要的应用价值。
申请公布号 CN101894264B 申请公布日期 2012.11.14
申请号 CN201010195097.8 申请日期 2010.05.31
申请人 中国科学院自动化研究所 发明人 肖柏华;张琳波;王春恒;惠康华;邵允学;蔡新元
分类号 G06K9/62(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 中科专利商标代理有限责任公司 11021 代理人 梁爱荣
主权项 基于短语包模型的图像类别标注方法,其特征在于,该图像类别标注方法,通过分析字包模型中视觉字之间的位置关系,将视觉字发展为视觉短语,进而提出基于短语包模型的图像内容表示,然后利用短语包模型的表示结果训练分类器以及输入分类器进行类别标注;所述基于短语包模型的图像内容表示包括步骤如下:步骤S1:对任意图像Ii,利用局部特征点检测子,得到图像中所有的局部特征点Pi={pij},j=1,2,...,Ni,其中Ni为在图像Ii中检测到的所有局部特征点的个数;步骤S2:对步骤S1得到的局部特征点pij,利用局部特征描述子,描述它周围局部区域的纹理特征,形成局部特征点pij的向量描述fij,将向量描述fij作为局部特征点pij对应的视觉字;步骤S3:对步骤S1得到的局部特征点pij,描述图像Ii中其它特征点piu∈Pi,u≠j在局部特征点pij周围的分布情况,形成分布向量sij;步骤S4:向量描述fij与分布向量sij联接,形成局部特征点pij对应的视觉短语zij,zij=[fij,sij];步骤S5:在所有图像得到的视觉短语中,随机选择M个视觉短语;对这M个视觉短语进行K‑均值聚类,形成K个聚类中心;选择K个具有代表性的视觉短语,构建码本C;将码本中的每个视觉短语作为码本短语;步骤S6:将每一幅图像Ii中的所有局部特征点pij对应的视觉短语zij按照最近邻原则,映射到码本C中距离它最近的码本短语上面,将该码本短语作为视觉短语zij的代表;步骤S7:统计码本C中每个码本短语在图像Ii中出现的次数,形成码本短语出现次数直方图向量vi,作为图像Ii的基于短语包模型的图像内容表示;步骤S3中所述描述图像Ii中其它特征点piu∈Pi,u≠j在局部特征点pij周围的分布情况具体方式如下:步骤S31:以局部特征点pij为圆心,分别以r1,r2,...,rR为半径画R个同 心圆;将得到的每个圆环,按照方向均匀O等分,得到的多个格子,需要注意的是最小的圆不作划分;步骤S32:统计图像Ii中其它特征点piu∈Pi,u≠j落入每个格子内的个数,未落入格子内的特征点忽略不计;步骤S33:属于同一方向的格子内点的个数相加,选择特征点数量最多的方向,作为局部特征点pij周围特征点分布的主方向θij;步骤S34:为了使得局部特征点pij对距离比较近的其它特征点敏感,而随着距离增加,影响减弱,将分别以r1,r2,...,rR为半径的R个同心圆为外界的格子内的个数分别除以δ1,δ2,...,δR,作为每个格子内的新的个数;步骤S35:顺次统计每个格子内的个数,形成特征点pij周围特征点分布向量sij;具体统计方式按照从里向外的方式,对处于同一圆环上的方格,从主方向θij开始,顺时针旋转统计。
地址 100080 北京市海淀区中关村东路95号