发明名称 一种交互式三维视频系统中的信号处理方法
摘要 本发明公开了一种交互式三维视频系统中的信号处理方法,其首先将每相邻的两个参考视点之间的多个虚拟视点作为辅助视点,并获取每个辅助视点的残差图像,然后服务端的三维视频编码模块对各幅彩色图像、深度图像和残差图像进行编码后传输给用户端,接着用户端的视点解码模块对编码后的各幅图像进行解码,最后任意视点绘制模块生成参考视点信号和辅助视点信号传输给视频显示模块进行显示,优点是由于在服务端只需要传输包含较少信息量的残差图像作为辅助视点信息,因此降低了系统服务端的编码复杂程度,由于在用户端只需要简单的三维映射和加法操作就能生成虚拟视点信号,因此降低了对用户端系统的要求,从而降低了交互式三维视频系统的复杂度。
申请公布号 CN103179423A 申请公布日期 2013.06.26
申请号 CN201310088990.4 申请日期 2013.03.19
申请人 宁波大学 发明人 邵枫;蒋刚毅;郁梅;李福;彭宗举
分类号 H04N13/00(2006.01)I;H04N15/00(2006.01)I;H04N7/26(2006.01)I 主分类号 H04N13/00(2006.01)I
代理机构 宁波奥圣专利代理事务所(普通合伙) 33226 代理人 周珏
主权项 1.一种交互式三维视频系统中的信号处理方法,该交互式三维视频系统主要由服务端的三维视频编码模块以及用户端的视点解码模块、任意视点绘制模块和视频显示模块构成,其特征在于该设计方法包括以下步骤:①获取t时刻的K个参考视点的K幅颜色空间为YUV的彩色图像及其对应的K幅深度图像,将t时刻的第k个参考视点的彩色图像记为<img file="FDA00002935964600011.GIF" wi="238" he="91" />将t时刻的第k个参考视点的深度图像记为<img file="FDA00002935964600012.GIF" wi="244" he="93" />其中,K≥2,1≤k≤K,k的初始值为1,i=1,2,3分别表示YUV颜色空间的三个分量,YUV颜色空间的第1个分量为亮度分量并记为Y、第2个分量为第一色度分量并记为U及第3个分量为第二色度分量并记为V,(x,y)表示彩色图像和深度图像中的像素点的坐标位置,1≤x≤W,1≤y≤H,W表示彩色图像和深度图像的宽度,H表示彩色图像和深度图像的高度,<img file="FDA00002935964600013.GIF" wi="172" he="80" />表示t时刻的第k个参考视点的彩色图像<img file="FDA00002935964600014.GIF" wi="214" he="93" />中坐标位置为(x,y)的像素点的第i个分量的值,<img file="FDA00002935964600015.GIF" wi="188" he="80" />表示t时刻的第k个参考视点的深度图像<img file="FDA00002935964600016.GIF" wi="218" he="89" />中坐标位置为(x,y)的像素点的深度值;②将t时刻的K个参考视点中每相邻的两个参考视点作为一对关联参考视点,将每对关联参考视点之间的N个虚拟视点均作为辅助视点,然后采用基于深度图像绘制的方法,获取t时刻的(K-1)×N个辅助视点各自的残差图像,将t时刻的第l个辅助视点的残差图像记为<img file="FDA00002935964600017.GIF" wi="247" he="90" />其中,N&gt;1,1≤l≤(K-1)×N,l的初始值为1,<img file="FDA00002935964600018.GIF" wi="183" he="77" />表示t时刻的第l个辅助视点的残差图像<img file="FDA00002935964600019.GIF" wi="229" he="93" />中坐标位置为(x,y)的像素点的第i个分量的值;③服务端的三维视频编码模块根据设定的编码预测结构,对t时刻的K个参考视点的K幅彩色图像及其对应的K幅深度图像、t时刻的(K-1)×N个辅助视点各自的残差图像进行编码,再将编码后的t时刻的K个参考视点的K幅彩色图像及其对应的K幅深度图像、t时刻的(K-1)×N个辅助视点各自的残差图像传输给用户端;④用户端的视点解码模块对编码后的t时刻的K个参考视点的K幅彩色图像及其对应的K幅深度图像、t时刻的(K-1)×N个辅助视点各自的残差图像进行解码,得到解码后的t时刻的K个参考视点的K幅彩色图像及其对应的K幅深度图像、t时刻的(K-1)×N个辅助视点各自的残差图像,将解码后的t时刻的第k个参考视点的彩色图像记为<img file="FDA00002935964600021.GIF" wi="236" he="98" />将解码后的t时刻的第k个参考视点的深度图像记为<img file="FDA00002935964600022.GIF" wi="246" he="91" />将解码后的t时刻的第l个辅助视点的残差图像记为<img file="FDA00002935964600023.GIF" wi="254" he="99" />其中,<img file="FDA00002935964600024.GIF" wi="176" he="84" />表示解码后的t时刻的第k个参考视点的彩色图像<img file="FDA00002935964600025.GIF" wi="213" he="91" />中坐标位置为(x,y)的像素点的第i个分量的值,<img file="FDA00002935964600026.GIF" wi="183" he="74" />表示解码后的t时刻的第k个参考视点的深度图像<img file="FDA00002935964600027.GIF" wi="219" he="93" />中坐标位置为(x,y)的像素点的深度值,<img file="FDA00002935964600028.GIF" wi="185" he="78" />表示解码后的t时刻的第l个辅助视点的残差图像<img file="FDA00002935964600029.GIF" wi="228" he="93" />中坐标位置为(x,y)的像素点的第i个分量的值;⑤根据用户所选择的视点,用户端的任意视点绘制模块根据解码后的t时刻的K个参考视点的K幅彩色图像和t时刻的(K-1)×N个辅助视点各自的残差图像,快速生成相应的参考视点信号和辅助视点信号,再将生成的参考视点信号和辅助视点信号传输给用户端的视频显示模块进行显示。
地址 315211 浙江省宁波市江北区风华路818号