发明名称 一种基于分类器的图像场景分层与对象遮挡处理方法
摘要 本发明是一种基于分类器的图像场景分层与对象遮挡处理方法,为自动判别图像场景的层次关系和处理对象遮挡关系提供了新的技术方案。本发明包括:在训练集上使用语义、位置、轮廓、公共边界和交界点五种遮挡线索的特征,训练得到判别遮挡关系的分类器;对测试图像使用遮挡关系分类器计算遮挡关系预测值,构建表示遮挡关系的带权有向图;使用层次排序推理算法,在带权有向图上推理出图像场景的层次结构;利用已得到的场景层次结构,处理新加入对象与已有场景对象的遮挡关系,生成图像虚拟场景。本发明可用于图像或视频虚拟场景的遮挡处理,图像或视频虚拟场景生成等应用。
申请公布号 CN102509119B 申请公布日期 2014.03.05
申请号 CN201110301899.7 申请日期 2011.09.30
申请人 北京航空航天大学 发明人 陈小武;赵沁平;李青;赵东悦
分类号 G06K9/66(2006.01)I 主分类号 G06K9/66(2006.01)I
代理机构 北京科迪生专利代理有限责任公司 11251 代理人 许玉明;顾炜
主权项 1.一种基于分类器的图像场景分层的对象遮挡处理方法,其特征在于该方法包含以下步骤:(1)在图像场景语义标记结果的基础上,利用对象语义、对象位置、对象轮廓、公共边界和交界点五种遮挡线索表征对象区域间的遮挡关系和层次关系,并检测训练数据集图像的上述五种遮挡线索,计算其特征响应值;(2)在训练数据集上采样遮挡关系样本,训练得到遮挡关系的分类器;(3)对于任意一张输入图像,给定其场景语义标记结果,检测上述五种遮挡线索信息,构建遮挡关系特征向量集合,利用已经训练好的分类器,得到属于这张图像的所有遮挡关系的预测值,以此构建表现遮挡关系的带权完全有向图;(4)在遮挡关系的带权完全有向图上推理求解得到图像场景的层次结构;(5)将用户感兴趣的对象加入到已分层场景的指定层次,根据对象间的前后层次正确处理遮挡,最终生成图像虚拟场景;上述五种遮挡线索的定义如下:对象语义关系的响应值计算,首先输入要计算语义关系的两对象R<sub>i</sub>和R<sub>j</sub>,由于在语义标记图中不同颜色表示不同的语义对象,所以识别两对象R<sub>i</sub>和R<sub>j</sub>的颜色,即识别两对象的语义信息,然后输入人工划分的分层结果,获得不同语义对象的遮挡关系直方图,横坐标和纵坐标都是数据集中所有的语义类别;以此直方图的统计结果作为语义遮挡线索的特征响应值;对象位置线索的数学模型为:<img file="FDA00003555877800011.GIF" wi="853" he="82" />对于两个区域对象R<sub>i</sub>和R<sub>j</sub>,根据遮挡线索检测计算出的各对象的区域中心位置,从中选择Y方向高度值<img file="FDA00003555877800013.GIF" wi="44" he="63" />和<img file="FDA00003555877800014.GIF" wi="48" he="66" />,H为图像高度;利用位置线索数学模型计算两对象从相对位置角度度量二者之间的遮挡关系值P<sub>pos</sub>,最后将该响应值返回;在对象轮廓线索检测中得到的各区域轮廓的面积和长度信息,利用轮廓紧凑性数学模型计算度量该对象单个区域轮廓的紧凑性与被遮挡关系的响应值,然后将该对象所有轮廓的响应值取平均值,最后将该平均值作为对象区域轮廓紧凑性的响应返回;区域R紧凑性数学模型如下,其中,L为轮廓长度,A为区域面积,n为区域所包含的像素个数,α为加权系数:<maths num="0001"><![CDATA[<math><mrow><msub><mi>p</mi><mi>com</mi></msub><mrow><mo>(</mo><mi>R</mi><mo>)</mo></mrow><mo>&ap;</mo><mi>exp</mi><mo>{</mo><mo>-</mo><mi>&alpha;</mi><mo>&CenterDot;</mo><mfrac><mrow><mi>n</mi><mo>-</mo><mi>L</mi><mo>/</mo><mi>A</mi></mrow><mrow><mi>n</mi><mo>-</mo><msqrt><mi>n</mi></msqrt></mrow></mfrac><mo>}</mo><mo>;</mo></mrow></math>]]></maths>为了描述区域间公共边界和遮挡关系之间的关系,利用曲率定义公共边界凸性模型函数为:<img file="FDA00003555877800021.GIF" wi="615" he="108" />其中,κ为公共边界任一点的曲率,<img file="FDA00003555877800022.GIF" wi="62" he="72" />为逆时针方向的公共边界曲线,L为公共边界曲线弧长;利用公共边界凸性模型计算两对象从公共边界线索判断遮挡关系的响应值p<sub>conv</sub>并将其返回;在给定两区域R<sub>i</sub>,R<sub>j</sub>遮挡关系R<sub>i</sub>&lt;R<sub>j</sub>,即R<sub>i</sub>遮挡R<sub>j</sub>,的条件下,定义并量化曲率变化反映遮挡关系的公共边界线索的数学模型为<maths num="0002"><![CDATA[<math><mrow><msub><mi>p</mi><mi>conv</mi></msub><mrow><mo>(</mo><mover><mi>L</mi><mo>&RightArrow;</mo></mover><mo>|</mo><msub><mi>R</mi><mi>i</mi></msub><mo>&lt;</mo><msub><mi>R</mi><mi>j</mi></msub><mo>)</mo></mrow><mo>,</mo></mrow></math>]]></maths>即<maths num="0003"><![CDATA[<math><mrow><msub><mi>p</mi><mi>conv</mi></msub><mrow><mo>(</mo><mover><mi>L</mi><mo>&RightArrow;</mo></mover><mo>|</mo><msub><mi>R</mi><mi>i</mi></msub><mo>&lt;</mo><msub><mi>R</mi><mi>j</mi></msub><mo>)</mo></mrow><mo>&Proportional;</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><mi>g</mi><mrow><mo>(</mo><msub><mover><mi>L</mi><mo>&RightArrow;</mo></mover><mi>i</mi></msub><mo>)</mo></mrow><mo>/</mo><mi>N</mi><mo>;</mo></mrow></math>]]></maths>其中,两对象间可能存在多条公共边界,N为区域R<sub>i</sub>,R<sub>j</sub>间的公共边界数目;定义交界点形状数学模型为:p<sub>ang</sub>(J|R<sub>i</sub>&lt;R<sub>j</sub>,R<sub>i</sub>&lt;R<sub>k</sub>)∝p<sub>J</sub>(θ<sub>1</sub>,θ<sub>2</sub>),其中,R<sub>i</sub>、R<sub>j</sub>、R<sub>k</sub>表示存在交界点的三个区域,其遮挡关系为R<sub>i</sub>&lt;R<sub>j</sub>,R<sub>i</sub>&lt;R<sub>k</sub>,即R<sub>i</sub>遮挡R<sub>j</sub>,R<sub>i</sub>遮挡R<sub>k</sub>;p<sub>J</sub>(θ<sub>1</sub>,θ<sub>2</sub>)为在当前遮挡关系下确定的向量夹角,θ<sub>1</sub>为区域R<sub>i</sub>所辖区域的角度,θ<sub>2</sub>为继续沿着逆时钟方向确定的向量夹角;交界点形状统计量计算,首先输入要计算交界点形状反映遮挡关系的交界点J<sub>t</sub>,然后根据在遮挡线索检测中计算得到的描述交界点形状的角度信息,利用上述定义的交界点形状数学模型计算三邻接对象区域间的遮挡关系响应值并返回。
地址 100191 北京市海淀区学院路37号