一种基于图像分割的级联可变形部件模型目标检测方法,申请号CN201510552958.6-传众专利搜索

发明名称	一种基于图像分割的级联可变形部件模型目标检测方法
摘要	本发明公开了一种基于图像分割的级联可变形部件模型目标检测方法，属于图像检测领域。本发明以级联可变形部件检测方法为基础，在目标检测阶段提取物体的HOG特征，并通过计算构建像素梯度的查询表以快速获取HOG特征向量，减少特征提取时间。并基于分水岭图像分割方法对图像进行处理，计算权值构建掩膜以分离HOG特征的前景和背景，从而降低图像背景对目标检测的影响，提高检测准确率。然后利用训练阶段得到的模板与图像金字塔进行卷积，并在匹配过程中对目标假设进行裁剪，计算相应得分响应最终检测出目标。本发明在保证检测速度的情况下提高了传统方法的检测准确率。
申请公布号	CN105225226A	申请公布日期	2016.01.06
申请号	CN201510552958.6	申请日期	2015.09.02
申请人	电子科技大学	发明人	罗光春;段贵多;秦科;王倩
分类号	G06T7/00(2006.01)I	主分类号	G06T7/00(2006.01)I
代理机构	电子科技大学专利中心 51203	代理人	张杨
主权项	一种基于图像分割的级联可变形部件模型目标检测方法，包括以下步骤：步骤1：可变形部件模型训练根据训练样本是否含有特定目标物体以及物体位置，训练出对应目标对象的模型；该模型包括描述目标整体特征的根模型、描述局部特征的部件模型和部件模型与根模型的弹性约束关系；训练好的模型表示为(P,P<sub>1</sub>,P<sub>2</sub>,…P<sub>n</sub>)，分别表示根模型P和n个部件模型P<sub>i</sub>。其中P<sub>i</sub>＝(F<sub>i</sub>,d<sub>i</sub>,v<sub>i</sub>,s<sub>i</sub>)，其中F<sub>i</sub>是模型的特征，d<sub>i</sub>是度量部件位置时的系数，v<sub>i</sub>表示部件模型相对于根模型的位置，s<sub>i</sub>表示部件的尺度；步骤1.1：根据训练样本提供的标签信息确定训练模型所需的正样本集和负样本集；标签信息是训练样本中用限定框标记的物体所在的区域以及物体种类；正样本是含有目标对象的图片，反之则为负样本；步骤1.2：初始化根模型根据正样本集中的限定框的大小信息，选择根模型的尺寸，通过SVM训练得到一个初始根模型；步骤1.3：更新根模型用初始根模型在样本数据中进行扫描并计算卷积得分，找出得分最大且和样本中标记的位置覆盖面积最大的位置，以此位置来更新训练样本中的限定框标记，使用经过重新标记的正样本和负样本重新组成新的样本库，更新根模型；步骤1.4：初始化部件模型在根位置上用贪婪算法计算出得分最大的区域，将此区域作为部件模型的位置；步骤1.5：使用不断更新的样本库训练更新模型，得到标准的可变形部件模型；步骤2：基于图像分割的级联可变形部件模型目标检测将步骤1得到的标准的可变形部件模型转换为级联可变形部件模型，然后利用级联模型在经过前景和背景分割的图像HOG特征上进行扫描匹配，并通过裁剪策略对目标假设进行提前裁剪，过滤不满足条件的目标假设，最终根据模型的不同，实现不同种类目标的检测；步骤2.1：基于查询表的图像HOG特征提取将待检测图像进行灰度化，采用Gamma校正法对灰度化之后的图像进行归一化，调节图像对比度，降低光照变化、噪声造成的干扰；计算获取三个查询表，分别存储对比度敏感方向通道索引，对比度不敏感方向通道索引以及水平和垂直方向梯度的组合；将图像划分为一个个小的cell即胞元，在计算每个像素点的梯度大小和方向时，通过查找查询表快速统计每个胞元的梯度直方图，形成该胞元的特征向量；将胞元组成block，串联胞元的特征向量组成block的特征向量；将图像中所有block的特征向量串联起来形成图像的HOG特征；步骤2.2：构建图像特征金字塔提取不同分辨率下图像的HOG特征，构成图像特征金字塔；在进行特征提取时采用特征金字塔的形式，获取不同分辨率下的图像特征，在进行模型匹配时在图像不同分辨率下进行，实现全面准确得匹配；步骤2.3：基于图像分割的HOG特征前景背景分割对原始图像进行形态学开闭运算消除图像噪声引起的局部极值，然后通过分水岭变换方法将图像分割为一个个小的区域；然后再利用归一化积相关灰度匹配算法度量每个区域之间的相似性，通过图形的形态模板将相邻的各个区域进行合并，形成前景区域，并将图像的前景和背景进行分离；再利用区域之间的相似度构建图像的掩膜，计算权值，并将该权值与图像HOG特征进行结合，将图像的HOG特征的前景和背景进行分离；权值计算公式为<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>M</mi><mo>[</mo><mi>i</mi><mo>]</mo><mo>=</mo><mfrac><mn>1</mn><mrow><mn>1</mn><mo>+</mo><mi>exp</mi><mrow><mo>(</mo><mrow><mo>-</mo><mfrac><mn>10</mn><mrow><mn>1</mn><mo>-</mo><mi>α</mi></mrow></mfrac><mrow><mo>(</mo><mrow><mi>f</mi><mo>[</mo><mi>i</mi><mo>]</mo><mo>-</mo><mi>α</mi></mrow><mo>)</mo></mrow></mrow><mo>)</mo></mrow></mrow></mfrac></mrow>]]></math><img file="FDA0000794710600000021.GIF" wi="720" he="204" /></maths>其中i的变化范围为部件模型中block的个数，f[i]表示block之间相似度，α表示预先设定的分割系数；得到权重值之后，将HOG特征和权值结合构建图像掩膜，分离图像的前景和背景；经过分割后的HOG特征表示为：H<sup>seg</sup>[i]＝[H[i],M[i]·H[i],M[i]]其中H[i]表示原始的HOG特征；步骤2.4：获得级联可变形模型利用PCA技术对步骤1得到的可变形部件模型进行降维，获得简化模型，以减少进行模型匹配时计算卷积得分的计算量，最后简化模型和原始模型一起构成级联模型；步骤2.5：计算模型匹配过程中对目标假设进行裁剪所用到的裁剪阈值采用样本图像，并用PAA方法训练得到裁剪阈值，根据裁剪阈值确定相应目标假设是否被裁剪；步骤2.6：模型匹配将获得的级联模型在分割好的图像HOG特征金字塔上进行扫描并求卷积得分，得分公式为：<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mi>s</mi><mi>c</mi><mi>o</mi><mi>r</mi><mi>e</mi><mrow><mo>(</mo><mi>ω</mi><mo>,</mo><msub><mi>δ</mi><mn>1</mn></msub><mo>,</mo><mo>...</mo><msub><mi>δ</mi><mi>n</mi></msub><mo>)</mo></mrow><mo>=</mo><msub><mi>m</mi><mn>0</mn></msub><mrow><mo>(</mo><mi>ω</mi><mo>)</mo></mrow><mo>+</mo><munderover><mo>Σ</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msub><mi>m</mi><mi>i</mi></msub><mo>(</mo><mrow><msub><mi>a</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>ω</mi><mo>)</mo></mrow><mo>&CirclePlus;</mo><msub><mi>δ</mi><mi>i</mi></msub></mrow><mo>)</mo><mo>-</mo><msub><mi>d</mi><mi>i</mi></msub><mo>(</mo><msub><mi>δ</mi><mi>i</mi></msub><mo>)</mo></mrow>]]></math><img file="FDA0000794710600000022.GIF" wi="1008" he="126" /></maths>其中ω表示的是部件模型在图像中实际所处的位置和尺度，m<sub>i</sub>(ω)表示将部件p<sub>i</sub>置于ω时的得分，a<sub>i</sub>(ω)表示部件p<sub>i</sub>在可变形部件模型中所处的标准位置，d<sub>i</sub>(δ)表示部件p<sub>i</sub>相对其在模型标准位置的形变代价，一个目标假设的得分为各个模型置于ω时所得分数减去各部件因位移产生的形变代价即为在该位置的匹配得分，在计算部件得分时，还需要遍历形变空间查找部件最优形变位置，其过程表示为：<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><mi>s</mi><mi>c</mi><mi>o</mi><mi>r</mi><mi>e</mi><mrow><mo>(</mo><mi>ω</mi><mo>)</mo></mrow><mo>=</mo><msub><mi>m</mi><mn>0</mn></msub><mrow><mo>(</mo><mi>ω</mi><mo>)</mo></mrow><mo>+</mo><munderover><mo>Σ</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><munder><mi>max</mi><mrow><msub><mi>δ</mi><mi>i</mi></msub><mo>&Element;</mo><mi>Δ</mi></mrow></munder><mrow><mo>(</mo><msub><mi>m</mi><mi>i</mi></msub><mo>(</mo><msub><mi>a</mi><mi>i</mi></msub><mo>(</mo><mi>ω</mi><mo>)</mo></mrow><mo>&CirclePlus;</mo><msub><mi>δ</mi><mi>i</mi></msub><mo>)</mo><mo>-</mo><msub><mi>d</mi><mi>i</mi></msub><mrow><mo>(</mo><msub><mi>δ</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>)</mo></mrow>]]></math><img file="FDA0000794710600000023.GIF" wi="975" he="125" /></maths>在相应目标假设位置计算根模型得分和部件得分，通过比较目标假设位置ω的得分和全局阈值T，确定该目标假设位置是否存在目标，全局阈值T的取值范围为[0,1]；利用之前计算得到的裁剪阈值，按阶段对目标假设位置进行裁剪，即提前排除不满足阈值条件的假设位置，不用完整计算所有部件得分和形变花费，最终获得满足阈值条件的所有目标假设集；步骤2.7：限定框预测在获得目标假设位置之后，需要标示目标在图片中的位置，即标定目标的限定框位置，根据目标假设中根模型和部件模型的位置，对限定框坐标位置进行预测；步骤2.8：非极大值抑制获取最终检测结果通过限定框预测之后获取一组预测的检测结果，通过非极大值抑制去除重复的预测结果，得到最终的检测结果。
地址	611731 四川省成都市高新区（西区）西源大道2006号