主权项 |
基于深度变分模型的空间显著性区域提取方法,其特征在于包括以下步骤: 步骤1,进行相机校正; 在世界坐标系中,相机位姿T<sub>cw</sub>可以表示为如下矩阵: T<sub>cw</sub>=[R<sub>cw</sub>,t<sub>cw</sub>] (1) 式中,下标cw表示从世界坐标系到当前相机坐标系,T<sub>cw</sub>∈SE(3),且SE(3):={[R,t]|R∈SO(3),t∈R<sup>3</sup>}。t<sub>cw</sub>、R<sub>cw</sub>由六元组ξ=(μ<sub>1</sub>,μ<sub>2</sub>,μ<sub>3</sub>,μ<sub>4</sub>,μ<sub>5</sub>,μ<sub>6</sub>)表示,即: <img file="FDA0000594949990000011.GIF" wi="1178" he="160" />式中,μ<sub>1</sub>,μ<sub>2</sub>,μ<sub>3</sub>为相机在世界坐标系下的坐标,μ<sub>4</sub>,μ<sub>5</sub>,μ<sub>6</sub>分别为世界坐标系下相机沿x,y,z方向上的旋转向量,ξ的数学表达式如下: <img file="FDA0000594949990000012.GIF" wi="1283" he="310" />相机的位姿T<sub>cw</sub>建立了相机坐标系下点P<sub>c</sub>到世界坐标系下点P<sub>w</sub>的变换关系,即: P<sub>c</sub>=T<sub>cw</sub>P<sub>w</sub> (4) 在相机坐标系下,三维空间点到像平面上的投影定义为: π(p)=K(x/z,y/z,1)<sup>T</sup> (5) <img file="FDA0000594949990000013.GIF" wi="1300" he="231" />式中,P∈R<sup>3</sup>的三维空间点,x,y,z为该点的坐标值,K为相机的内参矩阵,f<sub>u</sub>,f<sub>v</sub>为相机焦距,u<sub>0</sub>,v<sub>0</sub>为像平面中心坐标;根据当前坐标的深度值d,利用逆向投影法确定当前空间三维点坐标p,其坐标关系表示为: <img file="FDA0000594949990000014.GIF" wi="1263" he="90" />式中,<img file="FDA0000594949990000015.GIF" wi="44" he="69" />为u的齐次表达式;采用FOV模型实现对单目相机的矫正,其数学描述如下: <img file="FDA0000594949990000021.GIF" wi="529" he="160" /><img file="FDA0000594949990000022.GIF" wi="1261" he="143" />r<sub>u</sub>=||x<sub>u</sub>|| 式中,x<sub>u</sub>为像素归一化坐标,u<sub>d</sub>为畸变后像素坐标,ω为畸变系数,r<sub>d</sub>,r<sub>u</sub>分别为矫正前后归一化坐标到坐标系中心的距离; 利用上述相机模型,将图像像素坐标映射到归一化坐标平面,同时结合相机内参数矩阵K,实现图像畸变矫正,即: u=Kx<sub>n</sub> (9) 步骤2,基于变分模型的深度图的建立与求解; 步骤3,显著性粗提取; 原图像经显著性滤波器算法处理,获得初始显著性图OSM和亮度特征图IFM; 步骤4,显著性精细提取; 步骤5,显著性区域三维重建; 将提取的显著性区域范围反投影到深度图,获取显著性区域的深度图,结合相机投影模型实现当前环境下三维显著性区域的重建。 |