发明名称 基于飞行时间TOF相机的深度计算成像方法
摘要 本发明属于计算机视觉领域。在一般量化误差和过载误差之间取得平衡,使量化输出信噪比最优,本发明采取的技术方案是基于飞行时间TOF相机的深度计算成像方法,包括下列步骤:1)经过照相机标定,得到TOF相机和彩色相机各自的包括焦距、光心的内部参数和包括旋转、平移的外部参数;得到高分辨率图上的一些深度散点;2)构建能量函数的自回归模型项;3)构建能量函数的基础数据项和最终求解方程:利用初始的深度散点图构建能量函数的数据项;通过拉格朗日方程,将数据项和自回归项用一个因子λ联合在一起作为最终的求解方程;4)利用线性函数优化方法对优化方程进行求解。本发明主要应用于数字图像处理。
申请公布号 CN102663712B 申请公布日期 2014.09.17
申请号 CN201210110335.X 申请日期 2012.04.16
申请人 天津大学 发明人 杨敬钰;叶昕辰;侯春萍;李坤
分类号 G06T5/10(2006.01)I;G06T7/00(2006.01)I 主分类号 G06T5/10(2006.01)I
代理机构 天津市北洋有限责任专利代理事务所 12201 代理人 刘国威
主权项 一种基于飞行时间TOF相机的深度计算成像方法,其特征是,借助于一个200×200的TOF相机,一个640×480的彩色相机实现,彩色相机架在TOF相机的上方;所述方法包括下列步骤:1)经过照相机标定,得到TOF相机和彩色相机各自的包括焦距、光心的内部参数和包括旋转、平移的外部参数;根据TOF相机和彩色相机的内部、外部参数,将TOF相机生成的低分辨率深度图扭转到彩色相机的视角,得到高分辨率图上的一些深度散点;此时,深度散点图和彩色相机拍出来的彩色图像是对齐的,利用彩色图片对深度散点图进行优化;2)构建能量函数的自回归模型项:根据彩色图、导图以及每个像素点的邻域,对此像素点进行参数训练并代入自回归模型中,将得到自回归模型作为能量函数的一项列入求解方程;3)构建能量函数的基础数据项和最终求解方程:利用初始的深度散点图构建能量函数的数据项;通过拉格朗日方程,将数据项和自回归项用一个因子λ联合在一起作为最终的求解方程;4)利用线性函数优化方法对优化方程进行求解;自回归模型项的建立,具体包括以下步骤:21)利用彩色图像,对其中的每一个像素,选取邻域对其进行预测;22)用双边滤波作为训练每个像素参数的基本方法,得到彩色图上的预测系数a<sub>f,p</sub>,公式如下:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>a</mi><mrow><mi>f</mi><mo>,</mo><mi>p</mi></mrow></msub><mo>=</mo><mi>exp</mi><mrow><mo>(</mo><mo>-</mo><mfrac><msup><mrow><mo>|</mo><mi>f</mi><mo>-</mo><mi>p</mi><mo>|</mo></mrow><mn>2</mn></msup><msubsup><mrow><mn>2</mn><mi>&tau;</mi></mrow><mn>1</mn><mn>2</mn></msubsup></mfrac><mo>)</mo></mrow><mi>exp</mi><mrow><mo>(</mo><mo>-</mo><mfrac><mrow><msub><mi>&Sigma;</mi><mi>RGB</mi></msub><msup><mrow><mo>|</mo><mi>I</mi><mrow><mo>(</mo><mi>f</mi><mo>)</mo></mrow><mo>-</mo><mi>I</mi><mrow><mo>(</mo><mi>p</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup></mrow><mrow><mn>3</mn><mo>&times;</mo><msubsup><mrow><mn>2</mn><mi>&tau;</mi></mrow><mn>2</mn><mn>2</mn></msubsup></mrow></mfrac><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000487421900000011.GIF" wi="1381" he="175" /></maths>其中,对于当前像素f的邻域中每一个p点,I(f)是f点在彩色图I中的RGB三通道值,I(p)是p点在彩色图I中的RGB三通道值,Σ<sub>RGB</sub>代表RGB三通道所求得的|I(f)‑I(p)|<sup>2</sup>值之和,τ<sub>1</sub>,τ<sub>2</sub>分别为空间分辨率和彩色分辨率的调控参数,τ<sub>1</sub>,τ<sub>2</sub>取值范围均为1.0~5.0;23)用简单的双三次插值将原始的深度散点插值成一幅模糊的深度图像,也作为进行预测的图像,得到初始深度图上的预测系数a<sub>g</sub>,公式如下:<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><msub><mi>a</mi><mi>g</mi></msub><mo>=</mo><mi>exp</mi><mrow><mo>(</mo><mo>-</mo><mfrac><msup><mrow><mo>(</mo><msub><mi>D</mi><mi>g</mi></msub><mrow><mo>(</mo><mi>f</mi><mo>)</mo></mrow><mo>-</mo><msub><mi>D</mi><mi>g</mi></msub><mrow><mo>(</mo><mi>p</mi><mo>)</mo></mrow><mo>)</mo></mrow><mn>2</mn></msup><msubsup><mrow><mn>2</mn><mi>&tau;</mi></mrow><mi>g</mi><mn>2</mn></msubsup></mfrac><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000487421900000012.GIF" wi="1228" he="206" /></maths>其中,D<sub>g</sub>是插值后的深度图,D<sub>g</sub>(f)、D<sub>g</sub>(p)分别为f、p两点的深度值,τ<sub>g</sub>为控制a<sub>g</sub>大小的参数,τ<sub>g</sub>取值范围为4.0~9.0;24)将公式1)和2)预测的系数相乘,得到:a=a<sub>f,p</sub>×a<sub>g</sub>并带入到下式中作为自回归模型项:<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><msub><mi>E</mi><mi>AR</mi></msub><mo>=</mo><munder><mi>&Sigma;</mi><mrow><mi>f</mi><mo>&Element;</mo><mi>F</mi></mrow></munder><msup><mrow><mo>(</mo><mi>D</mi><mrow><mo>(</mo><mi>f</mi><mo>)</mo></mrow><mo>-</mo><munder><mi>&Sigma;</mi><mrow><mi>p</mi><mo>&Element;</mo><mi>S</mi></mrow></munder><mi>aD</mi><mrow><mo>(</mo><mi>p</mi><mo>)</mo></mrow><mo>)</mo></mrow><mn>2</mn></msup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000487421900000021.GIF" wi="1213" he="167" /></maths>其中,E<sub>AR</sub>为自回归模型项,D是欲求的高分辨率深度图,D(f)、D(p)分别为f、p两点的深度值,S是当前像素点的邻域范围,a为最终的预测系数。
地址 300072 天津市南开区卫津路92号