发明名称 基于显著区域稀疏表示的语义层次模型图像分类管理方法
摘要 本发明公开了一种基于显著区域稀疏表示的语义层次模型图像分类管理方法,所建立的模型可以从自底向上和自顶向下两个通道有效模拟人类分类管理图像的思维模式。本发明将显著检测模型融入图像管理模型的构建过程中:首先在图像显著区域的基础上,构建层次语义标注树HSLT;然后将HSLT用于对图像进行层次语义标注,从而获得对图像高层语义的认知;最后以层次语义标注信息为依据,建立图像层次管理模型。本发明符合人们管理图像的基本理念,按照语义信息有效的组织管理图像,比较形象的模拟人们管理存放图像的过程,减少了人力、物力和时间等消耗,具有重要的现实意义。
申请公布号 CN103246688A 申请公布日期 2013.08.14
申请号 CN201210504852.5 申请日期 2012.12.03
申请人 苏州大学 发明人 刘纯平;郑阳;季怡;吴健;龚声蓉
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 南京经纬专利商标代理有限公司 32200 代理人 曹毅
主权项 1.基于显著区域稀疏表示的语义层次模型图像分类管理方法,其特征在于,包括以下步骤:    步骤1)显著区域的建立    对源图像用显著对象检测方法对图像进行清晰度判断,当图像中存在子区域之间的清晰度差异时,则用非清晰区域抑制方法提取图像的显著区域;当图像中不存在清晰度差异时,则用多特征融合的显著检测模型计算图像的显著图,然后根据显著图提取图像的显著区域;    步骤2)图像语义标签获取    对显著区域的内容用STF方法进行自动语义标注,自动获取图像的最重要的语义主题标签以及图像显著区域的语义信息集;    步骤3)建立图像层次语义在训练阶段,假设训练集图像集合为<img file="2012105048525100001DEST_PATH_IMAGE002.GIF" wi="83" he="16" />,首先需要对训练集中的每幅图像<img file="2012105048525100001DEST_PATH_IMAGE004.GIF" wi="6" he="11" />,通过语义主题标签获取为其定位一个能代表<img file="DEST_PATH_IMAGE004A.GIF" wi="6" he="11" />主要语义信息的语义主题标签<img file="DEST_PATH_IMAGE006.GIF" wi="10" he="16" />,得到图像-标签集合<img file="DEST_PATH_IMAGE008.GIF" wi="160" he="16" />;然后需要人工为训练集中图像的<img file="DEST_PATH_IMAGE006A.GIF" wi="10" he="16" />定义其所属的<img file="DEST_PATH_IMAGE010.GIF" wi="7" he="7" />层次标签<img file="DEST_PATH_IMAGE012.GIF" wi="214" he="18" />,这样就可以得到图像-层次语义标签集合{<img file="DEST_PATH_IMAGE014.GIF" wi="245" he="18" />,<img file="DEST_PATH_IMAGE016.GIF" wi="221" he="16" />,……,<img file="DEST_PATH_IMAGE018.GIF" wi="214" he="16" />};最后,将图像-层语义标签集合用nCRP的思想训练构造成层次语义标注树HSLT;在测试阶段,首先将测试集<img file="DEST_PATH_IMAGE020.GIF" wi="85" he="16" />中的每幅图像<img file="DEST_PATH_IMAGE022.GIF" wi="9" he="15" />利用语义标签获取步骤提取与<img file="DEST_PATH_IMAGE022A.GIF" wi="9" he="15" />相对应的显著语义信息集<img file="DEST_PATH_IMAGE024.GIF" wi="49" he="18" />,得到与测试集相对应的图像-显著语义信息集集合<img file="DEST_PATH_IMAGE026.GIF" wi="279" he="18" />;然后用训练阶段生成的HSLT对每幅测试图像<img file="DEST_PATH_IMAGE022AA.GIF" wi="9" he="15" />进行层次标注,当前测试图像<img file="DEST_PATH_IMAGE022AAA.GIF" wi="9" he="15" />的主题类别为<img file="DEST_PATH_IMAGE028.GIF" wi="11" he="16" />,显著语义信息集为<img file="DEST_PATH_IMAGE030.GIF" wi="138" he="18" />,对<img file="DEST_PATH_IMAGE022AAAA.GIF" wi="9" he="15" />进行层次标注具体步骤如下:Step1:为当前图像<img file="DEST_PATH_IMAGE022AAAAA.GIF" wi="9" he="15" />创建语义路径集<img file="DEST_PATH_IMAGE032.GIF" wi="49" he="11" />并置空,取集合<img file="DEST_PATH_IMAGE024A.GIF" wi="49" he="18" />中的标签类别<img file="DEST_PATH_IMAGE034.GIF" wi="7" he="16" />;Step2:依次扫描HSLT的每个叶子节点,若存在叶子节点<img file="DEST_PATH_IMAGE036.GIF" wi="27" he="16" />的主题类别与当前取出的<img file="DEST_PATH_IMAGE034A.GIF" wi="7" he="16" />相对应,则停止扫描,转Step3;若不存在,则说明HSLT的测试集图像覆盖范围不够,将<img file="DEST_PATH_IMAGE034AA.GIF" wi="7" he="16" />的层次标签置为<img file="DEST_PATH_IMAGE038.GIF" wi="116" he="16" />,转Step5;Step3:从定位到的<img file="DEST_PATH_IMAGE036A.GIF" wi="27" he="16" />计算其逆语义路径为<img file="DEST_PATH_IMAGE040.GIF" wi="252" he="16" />;Step4:将Step3中得到的逆语义路径反转,从而得到<img file="DEST_PATH_IMAGE034AAA.GIF" wi="7" he="16" />的层次语义路径<img file="DEST_PATH_IMAGE042.GIF" wi="34" he="11" />=<img file="DEST_PATH_IMAGE044.GIF" wi="253" he="16" />;Step5:将当前获得的<img file="DEST_PATH_IMAGE042A.GIF" wi="34" he="11" />放入集合<img file="DEST_PATH_IMAGE032A.GIF" wi="49" he="11" />,若当前<img file="DEST_PATH_IMAGE024AA.GIF" wi="49" he="18" />集合不为空,继续取其中下一个标签<img file="DEST_PATH_IMAGE046.GIF" wi="10" he="18" />,转Step2;若当前<img file="DEST_PATH_IMAGE024AAA.GIF" wi="49" he="18" />为空,则转Step6;Step6:求取所得路径集合<img file="DEST_PATH_IMAGE048.GIF" wi="226" he="15" />的最长公共语义路径<img file="DEST_PATH_IMAGE050.GIF" wi="29" he="11" />,即为当前图像<img file="DEST_PATH_IMAGE022AAAAAA.GIF" wi="9" he="15" />的语义路径,也即<img file="DEST_PATH_IMAGE022AAAAAAA.GIF" wi="9" he="15" />的层次语义标注信息; Step7:结束;    步骤4)图像语义层次管理模型    在除叶子节点以外的每一层节点均建立了“…混合”文件夹,并同时在根目录下建立“其他”文件夹;    对于建立好的管理模型,需要用所有的训练集和测试集图片对其进行填充以实现其对图像库组织管理的功能;在填充模型过程中,根据每幅图像对应的层次语义标注信息,即最近公共语义路径,从管理模型的根节点开始,根据下一层次的语义信息选择相应的分支子节点,直到到达最长语义路径最末节点表示的语义文件夹,若最末端的语义文件夹是HSLT树的非叶子节点,则将图像存入该语义文件夹下的混合文件夹,其余的将图像存入该文件夹下。
地址 215000 江苏省苏州市工业园区仁爱路199号