发明名称 基于深度图像的对象检测方法及其实现装置
摘要 本发明公开了一种基于深度图像的对象检测方法及其实现装置。包括训练过程和检测过程,从相机中读取图像作为数据源,根据待检测物体距离相机的距离,在图像上对物体进行分割,在分割的基础上计算物体的外观和形状特征,根据计算出的物体的外观和形状特征训练针对于物体的分类器;利用训练过程中得到的分类器,对扫描窗口内的外观和形状特征进行判定,决定扫描窗口内是否包含目标物体,将图像金字塔每一层的检测结果进行融合,得到最终的检测结果。本发明的深度图像不受光照变化的影响,不易受到复杂的背景的影响,从而减小误检数目;显著提高了检测的速度,保证了系统的实时性。
申请公布号 CN103390164B 申请公布日期 2017.03.29
申请号 CN201210143962.3 申请日期 2012.05.10
申请人 南京理工大学 发明人 刘亚洲;孙权森
分类号 G06K9/62(2006.01)I;G06T7/00(2017.01)I 主分类号 G06K9/62(2006.01)I
代理机构 南京理工大学专利中心 32203 代理人 朱显国
主权项 一种基于深度图像的对象检测方法,其特征在于包括训练过程和检测过程,训练过程的步骤如下:a1)从相机中读取图像作为数据源;a2)根据待检测物体距离相机的距离,在图像上对物体进行分割;a3)在分割的基础上计算物体的外观和形状特征;a4)根据计算出的物体的外观和形状特征训练针对于物体的分类器;检测过程的步骤如下:b1)从相机中读取图像作为数据源;b2)根据物体距离相机的距离对其图像进行不同尺度的缩放,形成一个图像金字塔;b3)对于图像金字塔的每一层的图像上的非空区域,划分为多个扫描窗口;b4)在每一个扫描窗口内部,计算物体的外观和形状特征;b5)利用训练过程中得到的分类器,对扫描窗口内的外观和形状特征进行判定,决定扫描窗口内是否包含目标物体;b6)将图像金字塔每一层的检测结果进行融合,得到最终的检测结果;步骤b2)包括以下具体步骤:b21)给定输入图像对,包括可见光图像和深度图像,且输入图像对已经经过配准;b22)构建可见光图像金字塔和深度图像金字塔;b221):图像初始尺度s为1,标准检测窗口的大小为p×p;b222):图像尺度为s,对应的等效检测窗口大小为p*s,即对应的物体的像的大小为p*s;b223):当物体的像为p*s时,其对应的深度的取值范围为Z∈[C/(p*s)‑Δt/(p*s),C/(p*s)+Δt/(p*s)];b224):根据步骤b223))中的范围,获得当前深度图像:<maths num="0001"><math><![CDATA[<mrow><mi>D</mi><mrow><mo>(</mo><msub><mi>x</mi><mn>0</mn></msub><mo>,</mo><msub><mi>y</mi><mn>0</mn></msub><mo>)</mo></mrow><mo>=</mo><mfenced open = "{" close = ""><mtable><mtr><mtd><mrow><mi>Z</mi><mo>,</mo></mrow></mtd><mtd><mrow><mi>Z</mi><mo>&Element;</mo><mo>&lsqb;</mo><mi>C</mi><mo>/</mo><mrow><mo>(</mo><mi>p</mi><mo>*</mo><mi>s</mi><mo>)</mo></mrow><mo>-</mo><mi>&Delta;</mi><mi>t</mi><mo>/</mo><mrow><mo>(</mo><mi>p</mi><mo>*</mo><mi>s</mi><mo>)</mo></mrow><mo>,</mo><mi>C</mi><mo>/</mo><mrow><mo>(</mo><mi>p</mi><mo>*</mo><mi>s</mi><mo>)</mo></mrow><mo>+</mo><mi>&Delta;</mi><mi>t</mi><mo>/</mo><mrow><mo>(</mo><mi>p</mi><mo>*</mo><mi>s</mi><mo>)</mo></mrow><mo>&rsqb;</mo></mrow></mtd></mtr><mtr><mtd><mrow><mi>N</mi><mi>U</mi><mi>L</mi><mi>L</mi><mo>,</mo></mrow></mtd><mtd><mrow><mi>o</mi><mi>t</mi><mi>h</mi><mi>e</mi><mi>r</mi><mi>s</mi></mrow></mtd></mtr></mtable></mfenced></mrow>]]></math><img file="FDA0001010806550000011.GIF" wi="1454" he="150" /></maths>其中,(x<sub>0</sub>,y<sub>0</sub>)表示深度图像中的像素点的坐标位置;Z表示该位置上的物体的距离值;b225):根据深度图像D(·),分割出对应的可见光图像中的相应区域,表示为C(·);b226):根据当前图像尺度s缩小深度图像D(·)和可见光图像C(·),作为图像金字塔的第一层;b227):更新当前图像尺度s=s*Δs;b228):重复步骤b222)~b227),构建图像金字塔上的其他层次:可见光图像金字塔以及深度图像金字塔;b229):当图像金字塔的图像的尺寸小于标准检测窗口尺寸(x,y)时,构建过程终止。
地址 210094 江苏省南京市孝陵卫200号