发明名称 一种基于多类基元自主学的复杂目标自动识别方法
摘要 一种基于多类基元自主学的复杂目标自动识别方法,步骤为:a)建立多类目标图像代表集;b)对训练集中的图像做预处理,分别提取点状、线状、面状三类基元;c)在确认图像集中对获取的大量基元进行匹配计算、筛选合并,分别构建点、线、面三个基元字典;d)从字典中选取一定数量的基元,配对组合后作为弱分类器,通过自主学分别训练三类基元的强分类器;e)在概率投票空间下将三类基元强分类器结合,实现多类复杂目标的准确定位、轮廓提取和类型识别。本发明方法具有较高的智能化程度,能够满足多种类型复杂目标的识别和图像解译需求。
申请公布号 CN102436589B 申请公布日期 2015.05.06
申请号 CN201010298895.3 申请日期 2010.09.29
申请人 中国科学院电子学研究所 发明人 孙显;付琨;王宏琦
分类号 G06K9/66(2006.01)I 主分类号 G06K9/66(2006.01)I
代理机构 中科专利商标代理有限责任公司 11021 代理人 周国城
主权项 一种基于多类基元自主学习的复杂目标自动识别方法,其特征在于,该方法利用尺度、角度、目标质心进行空间变换和约束自主寻求最优匹配,并通过自主学习分别训练强分类器,在概率投票空间下实现对多类目标的定位、提取和识别,该方法包括以下步骤:第一步,建立多类复杂目标的图像代表集;第二步,对训练集中的图像提取点、线、面状基元,包括步骤:a)提取线状基元,用于描述目标的形状轮廓及内部边界;b)提取面状基元,用于描述目标的区域统计特性;c)提取点状基元,用于描述目标的尺度旋转特性;第三步,针对从训练图像中获取的大量基元,在确认图像集中进行匹配计算、筛选合并,分别构建点、线、面三个基元字典;第四步,从字典中选取一定数量的基元,配对组合后作为弱分类器,通过自主学习分别训练三类基元的强分类器;第五步,利用自主学习得到的三类基元强分类器,在概率投票空间下识别和提取多种类型的目标;其中,所述利用尺度、角度、目标质心进行空间变换和约束自主寻求最优匹配,包括:每个线状基元均包含在一个外接矩形r<sub>j</sub>=(r<sub>wi</sub>,r<sub>hi</sub>)中,其中r<sub>wi</sub>为外接矩形r<sub>i</sub>的宽,r<sub>wi</sub>为外接矩形r<sub>i</sub>的高,定义线状基元为<img file="FDA0000616860850000011.GIF" wi="418" he="85" />其中f<sub>i</sub>为线状基元<img file="FDA0000616860850000015.GIF" wi="50" he="83" />的像素列表,线状基元的质心为o<sub>i</sub>=(r<sub>wi</sub>+r<sub>hi</sub>)/2,d<sub>i</sub>为基元质心到目标质心Z<sub>o</sub>的相对距离,s<sub>i</sub>为线状基元的尺度因子,令<img file="FDA0000616860850000012.GIF" wi="331" he="106" />area(r<sub>i</sub>)为外接矩形r<sub>i</sub>的面积大小,<img file="FDA0000616860850000013.GIF" wi="46" he="69" />为基元质心相对目标质心水平线的逆时针旋转角度,利用d<sub>i</sub>和<img file="FDA0000616860850000014.GIF" wi="46" he="64" />一起能够预测出目标质心的位置,因而,每个基元在保持基本信息不变的条件下,都能够按照不同 的尺寸大小和旋转方向进行变换,寻求最佳匹配的形式,l<sub>i</sub>为目标所属类别;依此得到所有的线状基元<img file="FDA0000616860850000026.GIF" wi="75" he="71" />面状基元和点状基元也包含在外接矩形中,可采用同样的方法获取面状基元<img file="FDA0000616860850000021.GIF" wi="385" he="78" />和点状基元<img file="FDA0000616860850000022.GIF" wi="422" he="83" />各个变量的定义与线状基元的定义相同;因此,令B<sub>i</sub>统一指代线状基元、面状基元和点状基元;每个线状基元<img file="FDA0000616860850000028.GIF" wi="52" he="76" />在利用尺寸和方向变化寻求最佳匹配时有:B′<sub>i</sub>=B<sub>i</sub>  i=1,2,...,N   (2)其中,B′<sub>i</sub>为B<sub>i</sub>最佳匹配时的变换形式;当且仅当存在(τ<sub>i</sub>,υ<sub>i</sub>)满足以下条件时,等式成立:<img file="FDA0000616860850000023.GIF" wi="1188" he="394" />其中,f<sub>i</sub>和f′<sub>i</sub>分别为对象B<sub>i</sub>和B′<sub>i</sub>的像素列表,d<sub>i</sub>和d′<sub>i</sub>分别为对象B<sub>i</sub>和B′<sub>i</sub>的质心到目标质心的相对距离,s<sub>i</sub>和s′<sub>i</sub>分别为对象B<sub>i</sub>和B′<sub>i</sub>的尺度因子,<img file="FDA0000616860850000024.GIF" wi="51" he="74" />和<img file="FDA0000616860850000025.GIF" wi="52" he="87" />分别为对象B<sub>i</sub>和B′<sub>i</sub>相对目标质心水平线的逆时针旋转角度,τ<sub>i</sub>为比例参数,υ<sub>i</sub>为旋转参数,≌表示两者相等或相似,σ<sub>1</sub>,σ<sub>2</sub>分别为τ<sub>i</sub>,υ<sub>i</sub>的取值上下限。
地址 100190 北京市海淀区北四环西路19号