发明名称 基于轮廓锐度的单目图像深度信息估计方法
摘要 本发明提出一种基于轮廓锐度的单目图像深度信息估计方法,该方法应用边缘轮廓锐度作为模糊信息估计特征、通过低层次线索信息进行深度信息提取。首先对图像进行边缘检测;接着对图像中的边缘计算边缘能量、轮廓锐度,并以边缘能量、轮廓锐度作为轮廓的外部能量,结合轮廓的内部能量—轮廓线特征性能量和轮廓线距离能量建立轮廓跟踪模型,求解能量函数的最小值,搜索图像轮廓;然后以深度梯度假设作为先验假设梯度模型,对具有不同的轮廓线的区域进行深度值填充,计算得出深度分布;最后利用原图像信息和所得深度图像信息对得到的深度图像进行优化处理,得到最终的视差图。实验结果证明,本发明的深度估计算法简单,能快速准确地估计单目图像的深度图。
申请公布号 CN105374039A 申请公布日期 2016.03.02
申请号 CN201510786727.1 申请日期 2015.11.16
申请人 辽宁大学 发明人 马利;景源;李鹏;张玉奇;胡彬彬;牛斌
分类号 G06T7/00(2006.01)I 主分类号 G06T7/00(2006.01)I
代理机构 沈阳杰克知识产权代理有限公司 21207 代理人 罗莹
主权项 基于轮廓锐度的单目图像深度信息估计方法,其特征在于,包括如下步骤:(1)对于输入图像,进行边缘检测,得到图像中物体的边缘点P={p<sub>1</sub>,p<sub>2</sub>,…p<sub>n</sub>};(2)根据先验深度梯度模型进行初始轮廓线的定义,定义一组互相平行且间距相等的轮廓线作为初始轮廓线V={v<sub>0</sub>,v<sub>1</sub>...v<sub>m</sub>};其中,v(s)=[x(s),y(s)],x(s),y(s)为初始轮廓线中的点s的坐标;轮廓线的总能量定义为E<sub>total</sub>=w<sub>1</sub>E<sub>edge</sub>+w<sub>2</sub>E<sub>sharp</sub>+w<sub>3</sub>E<sub>s</sub>+w<sub>4</sub>E<sub>d</sub>其中E<sub>edge</sub>为轮廓边缘能量函数,表示轮廓的梯度幅度;E<sub>sharp</sub>轮廓锐度能量函数,代表轮廓的模糊程度;E<sub>s</sub>为轮廓线特性能量函数,用于约束轮廓的平滑度;E<sub>d</sub>为轮廓线距离能量函数,用于控制轮廓跟踪曲线不会超出搜索区域;w<sub>1</sub>、w<sub>2</sub>、w<sub>3</sub>、w<sub>4</sub>为各个函数权重控制参数;(3)对图像中每一条初始轮廓线从图像的左侧起始点开始,由图像底部向顶部更新每一轮廓点的位置,对每一个轮廓点根据步骤(2)中轮廓线总能量定义计算轮廓跟踪能量;(4)求解能量函数的最小值;对与当前轮廓点相邻的像素列中的像素点进行搜索,搜索满足能量函数定义的边缘点P={p<sub>1</sub>,p<sub>2</sub>,…p<sub>n</sub>}中具有最小能量值的点,选择具有最小能量的像素点位置作为新的轮廓点;从图像左侧至右侧,重复搜索最小值,得到最终的轮廓搜索结果,即得到目标轮廓线V;(5)以深度梯度假设作为先验假设梯度模型,对具有不同的轮廓线的区域进行深度值填充,计算得出深度分布;轮廓线集中轮廓线V={v<sub>0</sub>,v<sub>1</sub>,...,v<sub>m</sub>},对于i=0…m对应的分配深度值Depth为:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>D</mi><mi>e</mi><mi>p</mi><mi>t</mi><mi>h</mi><mrow><mo>(</mo><msub><mi>v</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>=</mo><mn>255</mn><mo>&times;</mo><mfrac><mrow><mi>m</mi><mo>-</mo><mi>i</mi></mrow><mi>m</mi></mfrac></mrow>]]></math><img file="FDA0000847636530000011.GIF" wi="411" he="103" /></maths>(6)利用原图像灰度信息和所得深度图像信息对得到的深度图像进行优化处理:<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><msup><msub><mi>Depth</mi><mi>f</mi></msub><mrow><mi>b</mi><mi>f</mi></mrow></msup><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>=</mo><mfrac><mn>1</mn><mrow><mi>W</mi><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>)</mo></mrow></mrow></mfrac><munder><mo>&Sigma;</mo><mrow><msub><mi>x</mi><mi>j</mi></msub><mo>&Element;</mo><mi>&Omega;</mi><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>)</mo></mrow></mrow></munder><mi>exp</mi><mrow><mo>(</mo><msub><mi>G</mi><msub><mi>&sigma;</mi><mi>s</mi></msub></msub><mo>(</mo><mrow><mo>|</mo><mo>|</mo><msub><mi>x</mi><mi>i</mi></msub><mo>-</mo><msub><mi>x</mi><mi>j</mi></msub><mo>|</mo><mo>|</mo></mrow><mo>)</mo><msub><mi>G</mi><msub><mi>&sigma;</mi><mi>r</mi></msub></msub><mo>(</mo><mrow><mi>I</mi><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>-</mo><mi>I</mi><mrow><mo>(</mo><msub><mi>x</mi><mi>j</mi></msub><mo>)</mo></mrow></mrow><mo>)</mo><mo>)</mo></mrow><mi>D</mi><mi>e</mi><mi>p</mi><mi>t</mi><mi>h</mi><mrow><mo>(</mo><msub><mi>x</mi><mi>j</mi></msub><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000847636530000012.GIF" wi="1262" he="123" /></maths><maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><mi>W</mi><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>=</mo><munder><mo>&Sigma;</mo><mrow><mi>q</mi><mo>&Element;</mo><mi>S</mi></mrow></munder><mi>exp</mi><mrow><mo>(</mo><msub><mi>G</mi><msub><mi>&sigma;</mi><mi>s</mi></msub></msub><mo>(</mo><mrow><mo>|</mo><mo>|</mo><msub><mi>x</mi><mi>i</mi></msub><mo>-</mo><msub><mi>x</mi><mi>j</mi></msub><mo>|</mo><mo>|</mo></mrow><mo>)</mo><msub><mi>G</mi><msub><mi>&sigma;</mi><mi>r</mi></msub></msub><mo>(</mo><mrow><mi>I</mi><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>-</mo><mi>I</mi><mrow><mo>(</mo><msub><mi>x</mi><mi>j</mi></msub><mo>)</mo></mrow></mrow><mo>)</mo><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000847636530000013.GIF" wi="812" he="103" /></maths>其中Depth(x<sub>i</sub>)为输入深度图像,Ω(x<sub>i</sub>)是以像素x<sub>i</sub>为中心的邻域,I(x<sub>i</sub>)为像素x<sub>i</sub>的亮度I分量,x<sub>j</sub>为像素x<sub>i</sub>在邻域Ω(x<sub>i</sub>)的邻域像素,W(x<sub>i</sub>)是滤波器参数的归一化因子;||x<sub>i</sub>‑x<sub>j</sub>||为两像素的空间欧式距离;I(x<sub>i</sub>)‑I(x<sub>j</sub>)表示两像素的亮度相似性,像素x<sub>i</sub>和x<sub>j</sub>的空间坐标分别为(x<sub>ix</sub>,x<sub>iy</sub>)和(x<sub>jx</sub>,x<sub>jy</sub>);空间权重系数<img file="FDA0000847636530000014.GIF" wi="70" he="62" />和色度权重系数<img file="FDA0000847636530000015.GIF" wi="63" he="63" />定义为:<maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><msub><mi>G</mi><msub><mi>&sigma;</mi><mi>s</mi></msub></msub><mrow><mo>(</mo><mo>|</mo><mo>|</mo><msub><mi>x</mi><mi>i</mi></msub><mo>-</mo><msub><mi>x</mi><mi>j</mi></msub><mo>|</mo><mo>|</mo><mo>)</mo></mrow><mo>=</mo><mfrac><msup><mrow><mo>&lsqb;</mo><msqrt><mrow><msup><mrow><mo>(</mo><msub><mi>x</mi><mrow><mi>j</mi><mi>x</mi></mrow></msub><mo>-</mo><msub><mi>x</mi><mrow><mi>i</mi><mi>x</mi></mrow></msub><mo>)</mo></mrow><mn>2</mn></msup><mo>+</mo><msup><mrow><mo>(</mo><msub><mi>x</mi><mrow><mi>j</mi><mi>y</mi></mrow></msub><mo>-</mo><msub><mi>x</mi><mrow><mi>i</mi><mi>y</mi></mrow></msub><mo>)</mo></mrow><mn>2</mn></msup></mrow></msqrt><mo>&rsqb;</mo></mrow><mn>2</mn></msup><mrow><mn>2</mn><msup><msub><mi>&sigma;</mi><mi>s</mi></msub><mn>2</mn></msup></mrow></mfrac></mrow>]]></math><img file="FDA0000847636530000016.GIF" wi="777" he="166" /></maths><maths num="0005" id="cmaths0005"><math><![CDATA[<mrow><msub><mi>G</mi><msub><mi>&sigma;</mi><mi>r</mi></msub></msub><mrow><mo>(</mo><mi>I</mi><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>)</mo><mo>-</mo><mi>I</mi><mo>(</mo><msub><mi>x</mi><mi>j</mi></msub><mo>)</mo><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mo>|</mo><mi>I</mi><mrow><mo>(</mo><msub><mi>x</mi><mi>j</mi></msub><mo>)</mo></mrow><mo>-</mo><mi>I</mi><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>)</mo></mrow><msup><mo>|</mo><mn>2</mn></msup></mrow><mrow><mn>2</mn><msup><msub><mi>&sigma;</mi><mi>r</mi></msub><mn>2</mn></msup></mrow></mfrac><mo>;</mo></mrow>]]></math><img file="FDA0000847636530000021.GIF" wi="667" he="149" /></maths>其中σ<sub>s</sub>为空间权重的方差、σ<sub>r</sub>为色度权重的方差。(7)得到了对输入单目图像进行深度信息估计后的视差图。
地址 110000 辽宁省沈阳市沈北新区道义南大街58号