发明名称 三维场景物体边界检测方法及装置
摘要 本发明提出一种三维场景物体边界检测方法,包括:计算三维图像的每个像素的亮度特征、颜色特征、亮度纹理特征和颜色纹理特征在多个方向上的微分;将每个像素的相同方向上的亮度特征的微分与亮度纹理特征的微分进行合并以生成第一微分,并将相同方向上的颜色特征的微分与颜色纹理特征的微分进行合并以生成第二微分;将每个像素的多个方向上的第一微分进行合并以生成第三微分,并将多个方向上的第二微分进行合并以生成第四微分;根据第三微分和第四微分计算每个像素为边界点的概率,得到物体边界图。本发明还提出了一种三维场景物体边界检测装置。本发明可以快速检测出三维场景中物体的边界,显著降低阴影和物体表面的纹理对边界识别效果的影响。
申请公布号 CN102737245B 申请公布日期 2014.06.11
申请号 CN201210185752.0 申请日期 2012.06.06
申请人 清华大学;北京华清美伦科技有限公司 发明人 戴琼海;林靖宇;曹汛;王竞瑶
分类号 G06T7/00(2006.01)I;G06K9/46(2006.01)I 主分类号 G06T7/00(2006.01)I
代理机构 北京清亦华知识产权代理事务所(普通合伙) 11201 代理人 张大威
主权项 1.一种三维场景物体边界检测方法,其特征在于,包括如下步骤:计算三维图像的每个像素的一个或多个特征在多个方向上的微分,其中,所述一个或多个特征包括亮度特征、颜色特征、亮度纹理特征和颜色纹理特征,具体包括:设当前像素点P,以像素P为中心,沿着方向θ,选取2W×W的窗口,并将所述窗口横向分为4个W/2×W的子窗口,然后计算每个子窗口的亮度直方图<img file="FDA0000437040360000011.GIF" wi="78" he="69" />和颜色直方图<img file="FDA0000437040360000012.GIF" wi="111" he="80" />其中i为子窗口的编号,根据所述每个子窗口的亮度直方图<img file="FDA0000437040360000013.GIF" wi="84" he="69" />和颜色直方图<img file="FDA0000437040360000014.GIF" wi="80" he="69" />分别计算亮度特征的微分、颜色特征的微分、亮度纹理特征的微分和颜色纹理特征的微分,其中,所述像素P在方向θ上的亮度特征的微分为:<img file="FDA0000437040360000015.GIF" wi="599" he="92" />所述像素P在方向θ上的颜色特征的微分为:<img file="FDA0000437040360000016.GIF" wi="603" he="93" />所述像素P在方向θ上的亮度纹理特征的微分为:<maths num="0001"><![CDATA[<math><mrow><msubsup><mi>G</mi><mi>txt</mi><mi>brt</mi></msubsup><mrow><mo>(</mo><mi>P</mi><mo>,</mo><mi>&theta;</mi><mo>)</mo></mrow><mo>=</mo><mi>f</mi><mo>[</mo><mi>d</mi><mrow><mo>(</mo><msubsup><mi>H</mi><mn>1</mn><mi>brt</mi></msubsup><mo>,</mo><msubsup><mi>H</mi><mn>3</mn><mi>brt</mi></msubsup><mo>)</mo></mrow><mo>+</mo><mi>d</mi><mrow><mo>(</mo><msubsup><mi>H</mi><mn>2</mn><mi>brt</mi></msubsup><mo>,</mo><msubsup><mi>H</mi><mn>4</mn><mi>brt</mi></msubsup><mo>)</mo></mrow><mo>]</mo><mo>,</mo></mrow></math>]]></maths>所述像素P在方向θ上的颜色纹理特征的微分为:<maths num="0002"><![CDATA[<math><mrow><msubsup><mi>G</mi><mi>txt</mi><mi>clr</mi></msubsup><mrow><mo>(</mo><mi>P</mi><mo>,</mo><mi>&theta;</mi><mo>)</mo></mrow><mo>=</mo><mi>f</mi><mo>[</mo><mi>d</mi><mrow><mo>(</mo><msubsup><mi>H</mi><mn>1</mn><mi>clr</mi></msubsup><mo>,</mo><msubsup><mi>H</mi><mn>3</mn><mi>clr</mi></msubsup><mo>)</mo></mrow><mo>+</mo><mi>d</mi><mrow><mo>(</mo><msubsup><mi>H</mi><mn>2</mn><mi>clr</mi></msubsup><mo>,</mo><msubsup><mi>H</mi><mn>4</mn><mi>clr</mi></msubsup><mo>)</mo></mrow><mo>]</mo><mo>;</mo></mrow></math>]]></maths>将所述每个像素的相同方向上的所述亮度特征的微分与所述亮度纹理特征的微分进行合并以生成第一微分,并将相同方向上的所述颜色特征的微分与所述颜色纹理特征的微分进行合并以生成第二微分,其中,所述第一微分为:<maths num="0003"><![CDATA[<math><mrow><msubsup><mi>G</mi><mi>cmb</mi><mi>brt</mi></msubsup><mrow><mo>(</mo><mi>P</mi><mo>,</mo><mi>&theta;</mi><mo>)</mo></mrow><mo>=</mo><mi>min</mi><mo>[</mo><msubsup><mi>G</mi><mi>int</mi><mi>brt</mi></msubsup><mo>,</mo><msubsup><mi>G</mi><mi>txt</mi><mi>brt</mi></msubsup><mo>]</mo><mo>,</mo></mrow></math>]]></maths>所述第二微分为:<maths num="0004"><![CDATA[<math><mrow><msubsup><mi>G</mi><mi>cmb</mi><mi>clr</mi></msubsup><mrow><mo>(</mo><mi>P</mi><mo>,</mo><mi>&theta;</mi><mo>)</mo></mrow><mo>=</mo><mi>min</mi><mo>[</mo><msubsup><mi>G</mi><mi>int</mi><mi>clr</mi></msubsup><mo>,</mo><msubsup><mi>G</mi><mi>txt</mi><mi>clr</mi></msubsup><mo>]</mo><mo>;</mo></mrow></math>]]></maths>将所述每个像素的所述多个方向上的多个第一微分进行合并以生成第三微分,并将所述多个方向上的多个第二微分进行合并以生成第四微分,其中,所述第三微分为:<img file="FDA00004370403600000111.GIF" wi="552" he="108" />所述第四微分为:<img file="FDA00004370403600000112.GIF" wi="556" he="126" />以及根据所述每个像素的所述第三微分和所述第四微分计算所述每个像素为边界点的概率,得到物体边界图,其中,所述每个像素为边界点的概率为:Pb(P)=αG<sup>brt</sup>(P)+(1-α)G<sup>clr</sup>(P),其中,Pb(P)为像素P是边界点的概率,α为亮度作为边界判定因素所占的权重。
地址 100084 北京市海淀区100084-82信箱