发明名称 基于分等级对象语义图的复杂目标自动识别方法
摘要 本发明公开了一种基于分等级对象语义图的复杂目标自动识别方法,涉及目标识别技术,步骤为:建立多类复杂目标图像代表集;对训练集图像进行多尺度分割,逐一计算各部件对象的特征信息,构建分等级语义图;采用螺旋式的混合学方式,利用判别式的分类器统计对象局部特性,结合产生式的消息传递机制计算对象间相互影响,推导求解分等级语义图;使用学得到的分等级对象语义图解译图像中的感兴趣目标,实现多类复杂目标的定位、提取和类型识别。本发明方法具有较高的智能化程度,能够满足自然和遥感场景图像中多类目标识别和图像解译的需求。
申请公布号 CN102542302B 申请公布日期 2013.08.14
申请号 CN201010597797.X 申请日期 2010.12.21
申请人 中国科学院电子学研究所 发明人 孙显;张道兵;付琨;王宏琦
分类号 G06K9/66(2006.01)I 主分类号 G06K9/66(2006.01)I
代理机构 中科专利商标代理有限责任公司 11021 代理人 周国城
主权项 1.一种基于分等级对象语义图的复杂目标自动识别方法,其特征在于,包括以下步骤:第一步,建立多类复杂目标的图像代表集,包括:A1、根据需要定义J个类别的复杂目标,类别编号为1~J,J为自然数;A2、对每个目标类别,选取200幅图像作为该类目标的代表图像,其中任选50幅图像作为训练集,其余的150幅图像作为测试集;A3、对每幅目标图像标记出目标所属类别及所在的区域范围;A4、将所有J类目标的图像代表合并为多类目标图像代表集;第二步,构建分等级语义图,用于描述图像场景中目标与背景的空间关系、以及目标的类别信息和结构组成,包括:B1、对训练图像{I<sub>1</sub>,I<sub>2</sub>,...,I<sub>M</sub>}分别进行多尺度分割,构建多尺度对象网络,其中M表示训练图像数目;B2、对每幅训练图像I对应地构建一幅分等级映射图<img file="FDA00002841143500011.GIF" wi="56" he="41" />该映射图的结构、大小均和原始训练图像分割后的多尺度结构一致;B3、对每一类目标的训练图像对应地构建一幅分等级语义图<img file="FDA00002841143500012.GIF" wi="59" he="47" />该语义图的结构和原始训练图像分割后的多尺度结构一致,其宽度和高度<img file="FDA00002841143500013.GIF" wi="57" he="47" />和<img file="FDA00002841143500014.GIF" wi="55" he="47" />则远远小于训练图像的宽度和高度;B4、逐一计算各个部件对象B的属性变量μ(B),用于描述部件对象的特征属性;B5、逐一定量计算各个部件对象B的位置变量λ<sup>-1</sup>(B),用于描述部件对象的空间分布;第三步,采用螺旋式的混合学习方式,将产生式和判别式的训练过程相互交叉,推导求解分等级语义图,方法是:C1、对分等级语义图进行产生式近似拟合;C2、初始化对象字典和语义图,从少量已完全标记的训练图像集合{I<sub>1</sub>,I<sub>2</sub>,...,I<sub>M′</sub>}中,<img file="FDA00002841143500015.GIF" wi="205" he="41" />选取若干对象组成部件对象字典<img file="FDA00002841143500016.GIF" wi="106" he="55" />对训练图像集合{I<sub>1</sub>,I<sub>2</sub>,...,I<sub>M′</sub>}各层次上的对象聚类,并以聚类后的结果作为初始的语义映射图集合<img file="FDA00002841143500021.GIF" wi="374" he="87" /><img file="FDA00002841143500022.GIF" wi="1859" he="165" />C4、使用产生式和判别式相结合的混合学习方式获取模型参数;第四步,使用获取的分等级对象语义图处理图像中的感兴趣目标,方法是:D1、输入待处理图像,按照与训练相同的参数进行多尺度分割;D2、统计各个层次对象的128维SIFT特征向量;D3、使用部件对象字典中的对象表达图像的各个层次,完成映射图的构建;D4、定性分析图像中各个区域的语义类别,得到图像的整体解译,或按照不同的需求目的,依据层次性和类别标记,提取感兴趣的目标区域,并采用图像分割、边界提取的辅助手段,实现感兴趣目标的精处理。
地址 100190 北京市海淀区北四环西路19号