基于深度图像的对象检测方法及其实现装置,申请号CN201210143962.3-传众专利搜索

发明名称	基于深度图像的对象检测方法及其实现装置
摘要	本发明公开了一种基于深度图像的对象检测方法及其实现装置。包括训练过程和检测过程，从相机中读取图像作为数据源，根据待检测物体距离相机的距离，在图像上对物体进行分割，在分割的基础上计算物体的外观和形状特征，根据计算出的物体的外观和形状特征训练针对于物体的分类器；利用训练过程中得到的分类器，对扫描窗口内的外观和形状特征进行判定，决定扫描窗口内是否包含目标物体，将图像金字塔每一层的检测结果进行融合，得到最终的检测结果。本发明的深度图像不受光照变化的影响，不易受到复杂的背景的影响，从而减小误检数目；显著提高了检测的速度，保证了系统的实时性。
申请公布号	CN103390164B	申请公布日期	2017.03.29
申请号	CN201210143962.3	申请日期	2012.05.10
申请人	南京理工大学	发明人	刘亚洲;孙权森
分类号	G06K9/62(2006.01)I;G06T7/00(2017.01)I	主分类号	G06K9/62(2006.01)I
代理机构	南京理工大学专利中心 32203	代理人	朱显国
主权项	一种基于深度图像的对象检测方法，其特征在于包括训练过程和检测过程,训练过程的步骤如下：a1)从相机中读取图像作为数据源；a2)根据待检测物体距离相机的距离，在图像上对物体进行分割；a3)在分割的基础上计算物体的外观和形状特征；a4)根据计算出的物体的外观和形状特征训练针对于物体的分类器；检测过程的步骤如下：b1)从相机中读取图像作为数据源；b2)根据物体距离相机的距离对其图像进行不同尺度的缩放，形成一个图像金字塔；b3)对于图像金字塔的每一层的图像上的非空区域，划分为多个扫描窗口；b4)在每一个扫描窗口内部，计算物体的外观和形状特征；b5)利用训练过程中得到的分类器，对扫描窗口内的外观和形状特征进行判定，决定扫描窗口内是否包含目标物体；b6)将图像金字塔每一层的检测结果进行融合，得到最终的检测结果；步骤b2)包括以下具体步骤：b21)给定输入图像对，包括可见光图像和深度图像，且输入图像对已经经过配准；b22)构建可见光图像金字塔和深度图像金字塔；b221)：图像初始尺度s为1，标准检测窗口的大小为p×p；b222)：图像尺度为s，对应的等效检测窗口大小为ps，即对应的物体的像的大小为ps；b223)：当物体的像为ps时，其对应的深度的取值范围为Z∈[C/(ps)‑Δt/(ps),C/(ps)+Δt/(ps)]；b224)：根据步骤b223))中的范围，获得当前深度图像：<maths num="0001"><math><![CDATA[<mrow><mi>D</mi><mrow><mo>(</mo><msub><mi>x</mi><mn>0</mn></msub><mo>,</mo><msub><mi>y</mi><mn>0</mn></msub><mo>)</mo></mrow><mo>=</mo><mfenced open = "{" close = ""><mtable><mtr><mtd><mrow><mi>Z</mi><mo>,</mo></mrow></mtd><mtd><mrow><mi>Z</mi><mo>&Element;</mo><mo>[</mo><mi>C</mi><mo>/</mo><mrow><mo>(</mo><mi>p</mi><mo></mo><mi>s</mi><mo>)</mo></mrow><mo>-</mo><mi>Δ</mi><mi>t</mi><mo>/</mo><mrow><mo>(</mo><mi>p</mi><mo></mo><mi>s</mi><mo>)</mo></mrow><mo>,</mo><mi>C</mi><mo>/</mo><mrow><mo>(</mo><mi>p</mi><mo></mo><mi>s</mi><mo>)</mo></mrow><mo>+</mo><mi>Δ</mi><mi>t</mi><mo>/</mo><mrow><mo>(</mo><mi>p</mi><mo></mo><mi>s</mi><mo>)</mo></mrow><mo>]</mo></mrow></mtd></mtr><mtr><mtd><mrow><mi>N</mi><mi>U</mi><mi>L</mi><mi>L</mi><mo>,</mo></mrow></mtd><mtd><mrow><mi>o</mi><mi>t</mi><mi>h</mi><mi>e</mi><mi>r</mi><mi>s</mi></mrow></mtd></mtr></mtable></mfenced></mrow>]]></math><img file="FDA0001010806550000011.GIF" wi="1454" he="150" /></maths>其中，(x<sub>0</sub>,y<sub>0</sub>)表示深度图像中的像素点的坐标位置；Z表示该位置上的物体的距离值；b225)：根据深度图像D(·)，分割出对应的可见光图像中的相应区域，表示为C(·)；b226)：根据当前图像尺度s缩小深度图像D(·)和可见光图像C(·)，作为图像金字塔的第一层；b227)：更新当前图像尺度s＝sΔs；b228)：重复步骤b222)～b227)，构建图像金字塔上的其他层次：可见光图像金字塔以及深度图像金字塔；b229)：当图像金字塔的图像的尺寸小于标准检测窗口尺寸(x,y)时，构建过程终止。
地址	210094 江苏省南京市孝陵卫200号