发明名称 一种基于深度图像绘制的立体视频编码方法
摘要 本发明公开了一种基于深度图像绘制的立体视频编码方法,其通过基于深度图像绘制的方法,将原始左视点彩色图像从左视点投影到右视点,得到原始右视点彩色图像与原始右视点彩色图像的绘制图像的残差图像,并对残差图像进行预处理操作,然后对原始左视点图像和预处理后的残差图像进行编码,最后根据解码后的右视点彩色图像的绘制图像和解码后的残差图像,得到解码后的右视点彩色图像的最终重构图像,本发明方法在保证较高的右视点彩色图像的重构质量的前提下,大大提高了立体视频的编码效率。
申请公布号 CN102438167A 申请公布日期 2012.05.02
申请号 CN201110322717.4 申请日期 2011.10.21
申请人 宁波大学 发明人 邵枫;蒋刚毅;郁梅
分类号 H04N13/00(2006.01)I;H04N15/00(2006.01)I;H04N7/26(2006.01)I 主分类号 H04N13/00(2006.01)I
代理机构 宁波奥圣专利代理事务所(普通合伙) 33226 代理人 程晓明;周珏
主权项 1.一种基于深度图像绘制的立体视频编码方法,其特征在于包括以下步骤:①将外部立体视频捕获工具捕获得到的未经处理的且颜色空间为YUV的彩色立体视频及其对应的深度立体视频定义为原始三维立体视频,在空域上该原始三维立体视频包括原始左视点三维视频和原始右视点三维视频,原始左视点三维视频包括原始左视点彩色视频和原始左视点深度视频,原始左视点彩色视频主要由若干个帧组的原始左视点彩色图像组成,原始左视点深度视频主要由若干个帧组的原始左视点深度图像组成,原始右视点三维视频包括原始右视点彩色视频和原始右视点深度视频,原始右视点彩色视频主要由若干个帧组的原始右视点彩色图像组成,原始右视点深度视频主要由若干个帧组的原始右视点深度图像组成;②将t时刻的原始左视点彩色图像记为<img file="FDA0000100684330000011.GIF" wi="222" he="76" />将t时刻的原始左视点深度图像记为<img file="FDA0000100684330000012.GIF" wi="235" he="76" />将t时刻的原始右视点彩色图像记为<img file="FDA0000100684330000013.GIF" wi="222" he="76" />将t时刻的原始右视点深度图像记为<img file="FDA0000100684330000014.GIF" wi="234" he="76" />其中,i=1,2,3分别表示YUV颜色空间的三个分量,YUV颜色空间的第1个分量为亮度分量并记为Y、第2个分量为第一色度分量并记为U及第3个分量为第二色度分量并记为V,(x,y)表示彩色图像或深度图像中像素点的坐标位置,1≤x≤W,1≤y≤H,W表示彩色图像或深度图像的宽度,H表示彩色图像或深度图像的高度,<img file="FDA0000100684330000015.GIF" wi="161" he="62" />表示t时刻的原始左视点彩色图像<img file="FDA0000100684330000016.GIF" wi="200" he="76" />中坐标位置为(x,y)的像素点的第i个分量的值,<img file="FDA0000100684330000017.GIF" wi="174" he="58" />表示t时刻的原始左视点深度图像<img file="FDA0000100684330000018.GIF" wi="210" he="76" />中坐标位置为(x,y)的像素点的深度值,<img file="FDA0000100684330000019.GIF" wi="163" he="62" />表示t时刻的原始右视点彩色图像<img file="FDA00001006843300000110.GIF" wi="200" he="76" />中坐标位置为(x,y)的像素点的第i个分量的值,<img file="FDA00001006843300000111.GIF" wi="177" he="58" />表示t时刻的原始右视点深度图像<img file="FDA00001006843300000112.GIF" wi="213" he="76" />中坐标位置为(x,y)的像素点的深度值;③采用基于深度图像绘制的方法,将t时刻的原始左视点彩色图像<img file="FDA00001006843300000113.GIF" wi="200" he="76" />从左视点投影到右视点,得到t时刻的原始右视点彩色图像的绘制图像,记为<img file="FDA00001006843300000114.GIF" wi="222" he="77" />其中,<img file="FDA00001006843300000115.GIF" wi="163" he="66" />表示t时刻的原始右视点彩色图像的绘制图像<img file="FDA00001006843300000116.GIF" wi="200" he="77" />中坐标位置为(x,y)的像素点的第i个分量的值;④计算t时刻的原始右视点彩色图像<img file="FDA0000100684330000021.GIF" wi="200" he="76" />与t时刻的原始右视点彩色图像的绘制图像<img file="FDA0000100684330000022.GIF" wi="200" he="77" />的残差图像,记为<img file="FDA0000100684330000023.GIF" wi="238" he="76" /><maths num="0001"><![CDATA[<math><mrow><msubsup><mi>E</mi><mrow><mi>t</mi><mo>,</mo><mi>i</mi></mrow><mi>R</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>=</mo><msubsup><mi>I</mi><mrow><mi>t</mi><mo>,</mo><mi>i</mi></mrow><mi>R</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>-</mo><msubsup><mover><mi>I</mi><mo>~</mo></mover><mrow><mi>t</mi><mo>,</mo><mi>i</mi></mrow><mi>R</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>,</mo></mrow></math>]]></maths>其中,<img file="FDA0000100684330000025.GIF" wi="175" he="63" />表示<img file="FDA0000100684330000026.GIF" wi="210" he="76" />中坐标位置为(x,y)的像素点的第i个分量的值;⑤对t时刻的原始右视点彩色图像<img file="FDA0000100684330000027.GIF" wi="200" he="76" />与t时刻的原始右视点彩色图像的绘制图像<img file="FDA0000100684330000028.GIF" wi="200" he="77" />的残差图像<img file="FDA0000100684330000029.GIF" wi="211" he="76" />进行预处理操作,得到预处理后的t时刻的原始右视点彩色图像<img file="FDA00001006843300000210.GIF" wi="200" he="76" />与t时刻的原始右视点彩色图像的绘制图像<img file="FDA00001006843300000211.GIF" wi="200" he="77" />的残差图像,记为<img file="FDA00001006843300000212.GIF" wi="235" he="77" />其中,<img file="FDA00001006843300000213.GIF" wi="175" he="67" />表示<img file="FDA00001006843300000214.GIF" wi="211" he="77" />中坐标位置为(x,y)的像素点的第i个分量的值;⑥根据设定的编码预测结构对t时刻的原始左视点彩色图像<img file="FDA00001006843300000215.GIF" wi="200" he="76" />进行编码,再将编码后的左视点彩色图像经网络传输给解码端;在解码端对编码后的左视点彩色图像进行解码,获得解码后的t时刻的左视点彩色图像,记为<img file="FDA00001006843300000216.GIF" wi="222" he="83" />其中,<img file="FDA00001006843300000217.GIF" wi="163" he="70" />表示解码后的t时刻的左视点彩色图像<img file="FDA00001006843300000218.GIF" wi="201" he="83" />中坐标位置为(x,y)的像素点的第i个分量的值;⑦根据设定的编码预测结构对预处理后的t时刻的原始右视点彩色图像<img file="FDA00001006843300000219.GIF" wi="200" he="76" />与t时刻的原始右视点彩色图像的绘制图像<img file="FDA00001006843300000220.GIF" wi="201" he="77" />的残差图像<img file="FDA00001006843300000221.GIF" wi="210" he="77" />进行编码,再将编码后的t时刻的残差图像经网络传输给解码端;在解码端对编码后的t时刻的残差图像进行解码,获得解码后的t时刻的残差图像,记为<img file="FDA00001006843300000222.GIF" wi="234" he="83" />其中,<img file="FDA00001006843300000223.GIF" wi="175" he="70" />表示解码后的t时刻的残差图像<img file="FDA00001006843300000224.GIF" wi="211" he="83" />中坐标位置为(x,y)的像素点的第i个分量的值;⑧采用与步骤③相同的操作,将解码后的t时刻的左视点彩色图像<img file="FDA00001006843300000225.GIF" wi="200" he="83" />从左视点投影到右视点,得到解码后的t时刻的右视点彩色图像的绘制图像,记为<img file="FDA00001006843300000226.GIF" wi="226" he="76" />其中,<img file="FDA00001006843300000227.GIF" wi="166" he="63" />表示解码后的t时刻的右视点彩色图像的绘制图像<img file="FDA00001006843300000228.GIF" wi="204" he="76" />中坐标位置为(x,y)的像素点的第i个分量的值;⑨根据解码后的t时刻的右视点彩色图像的绘制图像<img file="FDA00001006843300000229.GIF" wi="204" he="76" />和解码后的t时刻的残差图像<img file="FDA0000100684330000031.GIF" wi="236" he="83" />得到解码后的t时刻的右视点彩色图像的最终重构图像,记为<img file="FDA0000100684330000032.GIF" wi="225" he="83" />其中,<img file="FDA0000100684330000033.GIF" wi="163" he="70" />表示解码后的t时刻的右视点彩色图像的最终重构图像<img file="FDA0000100684330000034.GIF" wi="200" he="83" />中坐标位置为(x,y)的像素点的第i个分量的值。
地址 315211 浙江省宁波市江北区风华路818号