发明名称 一种立体图像重定位方法
摘要 本发明公开了一种立体图像重定位方法,其通过提取左视点图像的形状保护能量项、形状一致能量项、边界弯曲度能量项和舒适度保持能量项,并通过优化使得左视点图像的总能量最小,获取最佳相似变换矩阵,这样使得获得的重定位立体图像能够较好地保留重要的显著语义信息且保持视觉舒适性;其对立体图像的三维空间的水平坐标位置、垂直坐标位置和深度值同时进行调整,从而保留了重定位后的左视点图像重要的显著信息,同时又能保证与根据重定位后的左视差图获得的重定位后的右视点图像是匹配的,从而能够保证重定位后的立体图像的舒适性。
申请公布号 CN106570900A 申请公布日期 2017.04.19
申请号 CN201610886052.2 申请日期 2016.10.11
申请人 宁波大学 发明人 邵枫;林文崇;姜求平;李福
分类号 G06T7/593(2017.01)I 主分类号 G06T7/593(2017.01)I
代理机构 宁波奥圣专利代理事务所(普通合伙) 33226 代理人 周珏
主权项 一种立体图像重定位方法,其特征在于包括以下步骤:①将待处理的宽度为W且高度为H的立体图像的左视点图像、右视点图像及左视差图像对应记为{L(x,y)}、{R(x,y)}及{d<sub>L</sub>(x,y)};其中,1≤x≤W,1≤y≤H,W和H均能被8整除,L(x,y)表示{L(x,y)}中坐标位置为(x,y)的像素点的像素值,R(x,y)表示{R(x,y)}中坐标位置为(x,y)的像素点的像素值,d<sub>L</sub>(x,y)表示{d<sub>L</sub>(x,y)}中坐标位置为(x,y)的像素点的像素值;②将{L(x,y)}分割成<img file="FDA0001128477700000011.GIF" wi="152" he="119" />个互不重叠的尺寸大小为8×8的四边形网格;然后以{L(x,y)}中的每个四边形网格的左上、左下、右上和右下4个网格顶点的集合来描述{L(x,y)}中的每个四边形网格,将{L(x,y)}中的第k个四边形网格记为U<sub>L,k</sub>,<img file="FDA0001128477700000012.GIF" wi="557" he="87" />其中,1≤k≤M,<img file="FDA0001128477700000013.GIF" wi="650" he="117" />对应表示U<sub>L,k</sub>的左上网格顶点、左下网格顶点、右上网格顶点、右下网格顶点,<img file="FDA0001128477700000014.GIF" wi="78" he="70" />以<img file="FDA0001128477700000015.GIF" wi="78" he="70" />的水平坐标位置<img file="FDA0001128477700000016.GIF" wi="76" he="68" />和垂直坐标位置<img file="FDA0001128477700000017.GIF" wi="74" he="70" />来描述,<img file="FDA0001128477700000018.GIF" wi="454" he="79" />以<img file="FDA0001128477700000019.GIF" wi="81" he="70" />的水平坐标位置<img file="FDA00011284777000000110.GIF" wi="75" he="71" />和垂直坐标位置<img file="FDA00011284777000000111.GIF" wi="80" he="71" />来描述,<img file="DA00011284777037675.GIF" wi="357" he="86" /><img file="FDA00011284777000000112.GIF" wi="80" he="69" />以<img file="FDA00011284777000000113.GIF" wi="75" he="68" />的水平坐标位置<img file="FDA00011284777000000114.GIF" wi="75" he="69" />和垂直坐标位置<img file="FDA00011284777000000115.GIF" wi="75" he="70" />来描述,<img file="FDA00011284777000000116.GIF" wi="452" he="86" />以<img file="FDA00011284777000000117.GIF" wi="80" he="71" />的水平坐标位置<img file="FDA00011284777000000118.GIF" wi="74" he="71" />和垂直坐标位置<img file="FDA00011284777000000119.GIF" wi="74" he="70" />来描述,<img file="FDA00011284777000000120.GIF" wi="356" he="87" />并采用K‑mean聚类方法将{d<sub>L</sub>(x,y)}分割成P个分割对象,其中,P≥1;③根据{L(x,y)}中的每个四边形网格,获取对应的三维曲面网格,以{L(x,y)}中的每个三维曲面网格的左上、左下、右上和右下4个网格顶点的集合来描述{L(x,y)}中的每个三维曲面网格,将根据U<sub>L,k</sub>获取的对应的三维曲面网格记为V<sub>L,k</sub>,<img file="FDA00011284777000000121.GIF" wi="549" he="79" />其中,<img file="FDA00011284777000000122.GIF" wi="367" he="71" />对应表示V<sub>L,k</sub>的作为第1个网格顶点的左上网格顶点、作为第2个网格顶点的左下网格顶点、作为第3个网格顶点的右上网格顶点、作为第4个网格顶点的右下网格顶点,<img file="FDA0001128477700000021.GIF" wi="76" he="71" />以<img file="FDA0001128477700000022.GIF" wi="83" he="71" />的水平坐标位置<img file="FDA0001128477700000023.GIF" wi="71" he="68" />和垂直坐标位置<img file="FDA0001128477700000024.GIF" wi="82" he="70" />及深度值<img file="FDA0001128477700000025.GIF" wi="72" he="70" />来描述,<img file="FDA0001128477700000026.GIF" wi="553" he="79" />的水平坐标位置与<img file="FDA0001128477700000027.GIF" wi="81" he="70" />的水平坐标位置相等,<img file="FDA0001128477700000028.GIF" wi="77" he="70" />的垂直坐标位置与<img file="FDA0001128477700000029.GIF" wi="82" he="70" />的垂直坐标位置相等,<img file="FDA00011284777000000210.GIF" wi="78" he="69" />以<img file="FDA00011284777000000211.GIF" wi="75" he="70" />的水平坐标位置<img file="FDA00011284777000000212.GIF" wi="74" he="70" />和垂直坐标位置<img file="FDA00011284777000000213.GIF" wi="79" he="71" />及深度值<img file="FDA00011284777000000214.GIF" wi="72" he="69" />来描述,<img file="FDA00011284777000000215.GIF" wi="542" he="85" />的水平坐标位置与<img file="FDA00011284777000000216.GIF" wi="76" he="70" />的水平坐标位置相等,<img file="FDA00011284777000000217.GIF" wi="77" he="71" />的垂直坐标位置与<img file="FDA00011284777000000218.GIF" wi="82" he="71" />的垂直坐标位置相等,<img file="FDA00011284777000000219.GIF" wi="77" he="70" />以<img file="FDA00011284777000000220.GIF" wi="83" he="71" />的水平坐标位置<img file="FDA00011284777000000221.GIF" wi="74" he="70" />和垂直坐标位置<img file="FDA00011284777000000222.GIF" wi="78" he="71" />及深度值<img file="FDA00011284777000000223.GIF" wi="70" he="70" />来描述,<img file="FDA00011284777000000224.GIF" wi="550" he="86" />的水平坐标位置与<img file="FDA00011284777000000225.GIF" wi="75" he="69" />的水平坐标位置相等,<img file="FDA00011284777000000226.GIF" wi="77" he="70" />的垂直坐标位置与<img file="FDA00011284777000000227.GIF" wi="75" he="70" />的垂直坐标位置相等,<img file="FDA00011284777000000228.GIF" wi="78" he="69" />以<img file="FDA00011284777000000229.GIF" wi="75" he="70" />的水平坐标位置<img file="FDA00011284777000000230.GIF" wi="73" he="70" />和垂直坐标位置<img file="FDA00011284777000000231.GIF" wi="75" he="71" />及深度值<img file="FDA00011284777000000232.GIF" wi="74" he="71" />来描述,<img file="FDA00011284777000000233.GIF" wi="561" he="76" />的水平坐标位置与<img file="FDA00011284777000000234.GIF" wi="83" he="70" />的水平坐标位置相等,<img file="FDA00011284777000000235.GIF" wi="78" he="71" />的垂直坐标位置与<img file="FDA00011284777000000236.GIF" wi="79" he="69" />的垂直坐标位置相等;④采用基于图论的视觉显著模型提取出{L(x,y)}的显著图,记为{SM<sub>L</sub>(x,y)};然后根据{SM<sub>L</sub>(x,y)}和{d<sub>L</sub>(x,y)},获取{L(x,y)}的视觉显著图,记为{S<sub>L</sub>(x,y)};其中,SM<sub>L</sub>(x,y)表示{SM<sub>L</sub>(x,y)}中坐标位置为(x,y)的像素点的像素值,S<sub>L</sub>(x,y)表示{S<sub>L</sub>(x,y)}中坐标位置为(x,y)的像素点的像素值;⑤根据{L(x,y)}中的所有三维曲面网格对应的P个候选目标三维曲面网格,对{L(x,y)}中的每个三维曲面网格的各个网格顶点分别进行相似变换,使得原三维曲面网格与原三维曲面网格经过相似变换后得到的候选目标三维曲面网格的变换误差最小,得到{L(x,y)}中的每个三维曲面网格对应的各个候选目标三维曲面网格的相似变换矩阵,将V<sub>L,k</sub>对应的第p个候选目标三维曲面网格的相似变换矩阵记为<img file="FDA00011284777000000237.GIF" wi="114" he="78" /><img file="FDA00011284777000000238.GIF" wi="708" he="118" />其中,1≤p≤P,<img file="FDA00011284777000000239.GIF" wi="85" he="77" />表示V<sub>L,k</sub>对应的第p个候选目标三维曲面网格,<img file="DA00011284777036856.GIF" wi="567" he="86" /><img file="FDA00011284777000000240.GIF" wi="365" he="82" />对应表示<img file="FDA00011284777000000241.GIF" wi="83" he="71" />的作为第1个网格顶点的左上网格顶点、作为第2个网格顶点的左下网格顶点、作为第3个网格顶点的右上网格顶点、作为第4个网格顶点的右下网格顶点,<img file="FDA0001128477700000031.GIF" wi="76" he="71" />表示<img file="FDA0001128477700000032.GIF" wi="82" he="71" />的第i个网格顶点,i=1,2,3,4,<img file="DA00011284777036904.GIF" wi="769" he="910" /><img file="FDA0001128477700000033.GIF" wi="525" he="910" />和<img file="FDA0001128477700000034.GIF" wi="72" he="74" />对应表示<img file="FDA0001128477700000035.GIF" wi="75" he="71" />的水平坐标位置、垂直坐标位置和深度值,<img file="FDA0001128477700000036.GIF" wi="214" he="71" />和<img file="FDA0001128477700000037.GIF" wi="75" he="70" />对应表示<img file="FDA0001128477700000038.GIF" wi="79" he="78" />的水平坐标位置、垂直坐标位置和深度值,<img file="FDA0001128477700000039.GIF" wi="210" he="70" />和<img file="FDA00011284777000000310.GIF" wi="74" he="69" />对应表示<img file="FDA00011284777000000311.GIF" wi="82" he="70" />的水平坐标位置、垂直坐标位置和深度值,<img file="FDA00011284777000000312.GIF" wi="214" he="70" />和<img file="FDA00011284777000000313.GIF" wi="76" he="71" />对应表示<img file="FDA00011284777000000314.GIF" wi="82" he="69" />的水平坐标位置、垂直坐标位置和深度值,(A<sub>L,k</sub>)<sup>T</sup>为A<sub>L,k</sub>的转置,((A<sub>L,k</sub>)<sup>T</sup>A<sub>L,k</sub>)<sup>‑1</sup>为(A<sub>L,k</sub>)<sup>T</sup>A<sub>L,k</sub>的逆;⑥根据{L(x,y)}中的每个三维曲面网格对应的各个候选目标三维曲面网格的相似变换矩阵,并结合{S<sub>L</sub>(x,y)},计算在{L(x,y)}中的所有三维曲面网格对应的同一个候选目标三维曲面网格的相似变换矩阵下{L(x,y)}的形状保护能量项,将在{L(x,y)}中的所有三维曲面网格对应的第p个候选目标三维曲面网格的相似性变换矩阵下{L(x,y)}的形状保护能量项记为<img file="FDA00011284777000000315.GIF" wi="98" he="63" />⑦通过判断{L(x,y)}中的每个三维曲面网格和与其相邻的三维曲面网格是否属于相同的分割对象,并结合{S<sub>L</sub>(x,y)}和{L(x,y)}中的每个三维曲面网格对应的各个候选目标三维曲面网格的相似变换矩阵,计算在{L(x,y)}中的所有三维曲面网格对应的同一个候选目标三维曲面网格的相似变换矩阵下{L(x,y)}的形状一致能量项,将在{L(x,y)}中的所有三维曲面网格对应的第p个候选目标三维曲面网格的相似性变换矩阵下{L(x,y)}的形状一致能量项记为<img file="FDA0001128477700000041.GIF" wi="99" he="55" />⑧根据{L(x,y)}中的每个三维曲面网格的各个网格顶点的边缘和{L(x,y)}中的每个三维曲面网格经过每次相似变换后得到的候选目标三维曲面网格的各个网格顶点的边缘,计算在{L(x,y)}中的所有三维曲面网格对应的同一个候选目标三维曲面网格的相似变换矩阵下{L(x,y)}的边界弯曲度能量项,将在{L(x,y)}中的所有三维曲面网格对应的第p个候选目标三维曲面网格的相似性变换矩阵下{L(x,y)}的边界弯曲度能量项记为<img file="FDA0001128477700000042.GIF" wi="95" he="61" />⑨根据{L(x,y)}中的每个三维曲面网格的各个网格顶点的深度值和{L(x,y)}中的每个三维曲面网格经过每次相似变换后得到的候选目标三维曲面网格的各个网格顶点的深度值,计算在{L(x,y)}中的所有三维曲面网格对应的同一个候选目标三维曲面网格的相似变换矩阵下{L(x,y)}的舒适度保持能量项,将在{L(x,y)}中的所有三维曲面网格对应的第p个候选目标三维曲面网格的相似性变换矩阵下{L(x,y)}的舒适度保持能量项记为<img file="FDA0001128477700000043.GIF" wi="99" he="62" />⑩计算在{L(x,y)}中的所有三维曲面网格对应的同一个候选目标三维曲面网格的相似变换矩阵下{L(x,y)}的总能量,将在{L(x,y)}中的所有三维曲面网格对应的第p个候选目标三维曲面网格的相似性变换矩阵下{L(x,y)}的总能量记为<img file="FDA0001128477700000044.GIF" wi="121" he="62" /><img file="FDA0001128477700000045.GIF" wi="950" he="63" />然后根据{L(x,y)}中的所有三维曲面网格对应的所有候选目标三维曲面网格的相似变换矩阵,令<img file="FDA0001128477700000046.GIF" wi="91" he="63" />表示在{L(x,y)}中的所有三维曲面网格对应的所有候选目标三维曲面网格的最佳相似变换矩阵下{L(x,y)}的总能量,<img file="FDA0001128477700000047.GIF" wi="389" he="95" />并将<img file="FDA0001128477700000048.GIF" wi="91" he="63" />相应的V<sub>L,k</sub>对应的最佳相似变换矩阵记为<img file="FDA0001128477700000049.GIF" wi="115" he="71" />其中,ω<sub>1</sub>、ω<sub>2</sub>、ω<sub>3</sub>和ω<sub>4</sub>均为加权参数,min()为取最小值函数;<img file="FDA00011284777000000525.GIF" wi="56" he="56" />根据{L(x,y)}中的每个三维曲面网格对应的最佳相似变换矩阵,计算{L(x,y)}中的每个三维曲面网格中的每个像素点经最佳相似变换后的水平坐标位置、垂直坐标位置和深度值,将V<sub>L,k</sub>中水平坐标位置为x'<sub>L,k</sub>、垂直坐标位置y'<sub>L,k</sub>和深度值z'<sub>L,k</sub>的像素点经最佳相似变换后的水平坐标位置、垂直坐标位置和深度值对应记为<img file="FDA0001128477700000051.GIF" wi="226" he="71" />和<img file="FDA0001128477700000052.GIF" wi="105" he="70" /><img file="FDA0001128477700000053.GIF" wi="219" he="70" />和<img file="FDA0001128477700000055.GIF" wi="81" he="71" />通过求解<img file="FDA0001128477700000056.GIF" wi="739" he="111" />得到,其中,1≤x'<sub>L,k</sub>≤W,1≤y'<sub>L,k</sub>≤H,<img file="FDA0001128477700000057.GIF" wi="478" he="175" />e表示待处理的立体图像的左视点与右视点之间的水平基线距离,D表示待处理的立体图像的左视点和右视点与显示器之间的观看距离,W<sub>d</sub>表示显示器的水平宽度,R表示显示器的水平分辨率,d'<sub>L,k</sub>表示{d<sub>L</sub>(x,y)}中坐标位置为(x'<sub>L,k</sub>,y'<sub>L,k</sub>)的像素点的像素值,<img file="FDA0001128477700000058.GIF" wi="830" he="232" />(A'<sub>L,k</sub>)<sup>T</sup>为A'<sub>L,k</sub>的转置,((A'<sub>L,k</sub>)<sup>T</sup>A'<sub>L,k</sub>)<sup>‑1</sup>为(A'<sub>L,k</sub>)<sup>T</sup>A'<sub>L,k</sub>的逆,<img file="FDA0001128477700000059.GIF" wi="293" he="230" /><img file="FDA00011284777000000526.GIF" wi="56" he="59" />根据{L(x,y)}中的每个三维曲面网格中的每个像素点经最佳相似变换后的水平坐标位置、垂直坐标位置和深度值,获得重定位后的左视点图像和重定位后的左视点深度图,对应记为<img file="FDA00011284777000000510.GIF" wi="208" he="84" />和<img file="FDA00011284777000000511.GIF" wi="251" he="70" />然后根据<img file="FDA00011284777000000512.GIF" wi="251" he="70" />获取重定位后的左视差图像,记为<img file="FDA00011284777000000513.GIF" wi="260" he="87" />将<img file="FDA00011284777000000514.GIF" wi="230" he="86" />中坐标位置为(x',y')的像素点的像素值记为<img file="DA00011284777036963.GIF" wi="222" he="81" /><img file="FDA00011284777000000515.GIF" wi="651" he="215" />接着根据<img file="FDA00011284777000000516.GIF" wi="211" he="86" />和<img file="FDA00011284777000000517.GIF" wi="257" he="86" />获取重定位后的右视点图像,记为<img file="FDA00011284777000000518.GIF" wi="243" he="86" />将<img file="FDA00011284777000000519.GIF" wi="216" he="86" />中坐标位置为(x',y')的像素点的像素值记为<img file="FDA00011284777000000520.GIF" wi="866" he="71" />最后将<img file="FDA00011284777000000521.GIF" wi="206" he="85" />和<img file="FDA00011284777000000522.GIF" wi="215" he="85" />构成重定位后的立体图像;其中,1≤x'≤W',1≤y'≤H,W'表示重定位后的立体图像的宽度,H亦为重定位后的立体图像的高度,<img file="FDA00011284777000000523.GIF" wi="170" he="70" />表示<img file="FDA00011284777000000524.GIF" wi="211" he="86" />中坐标位置为(x',y')的像素点的像素值,<img file="FDA0001128477700000061.GIF" wi="190" he="62" />表示<img file="FDA0001128477700000062.GIF" wi="221" he="70" />中坐标位置为(x',y')的像素点的像素值,<img file="FDA0001128477700000063.GIF" wi="395" he="77" />表示<img file="FDA0001128477700000064.GIF" wi="208" he="85" />中坐标位置为<img file="FDA0001128477700000065.GIF" wi="358" he="74" />的像素点的像素值。
地址 315211 浙江省宁波市江北区风华路818号