发明名称 一种基于视觉的多视点视频信号编码方法
摘要 本发明公开了一种基于视觉的多视点视频信号编码方法,通过建立被编码的视频图像的视觉显著性图对视频图像感兴趣区域进行划分,在其后的编码过程中,在人眼比较感兴趣的区域采用较小的编码量化参数,而在人眼不太感兴趣的区域采用较大的编码量化参数。虽然本发明在人眼关注度比较低的区域分配较少的码率,但这些区域由于编码所造成的失真不会或很少引起人眼的察觉,因而对图像整体质量的影响并不明显,而与此同时却极大地节省了码率;而在人眼关注度比较高的区域分配较多的码率,可以提高解码图像的整体主观视觉质量,从而提高多视点视频信号编码效率。
申请公布号 CN102158712A 申请公布日期 2011.08.17
申请号 CN201110069318.1 申请日期 2011.03.22
申请人 宁波大学 发明人 郁梅;卢小明;蒋刚毅;彭宗举;邵枫
分类号 H04N7/50(2006.01)I;H04N13/00(2006.01)I 主分类号 H04N7/50(2006.01)I
代理机构 宁波奥圣专利代理事务所(普通合伙) 33226 代理人 程晓明
主权项 1.一种基于视觉的多视点视频信号编码方法,其特征在于首先建立被编码的视频图像的视觉显著性图以对视频图像感兴趣区域进行划分,在其后的编码过程中,在人眼比较感兴趣的区域分配较多的码率,而在人眼不太感兴趣的区域分配较少的码率,具体包括以下步骤:①计算得到静态视觉的亮度显著性图A<sub>I</sub>、颜色显著性图A<sub>H,S</sub>和方向显著性图A<sub>θ</sub>:A1.记多视点视频中当前正在处理的t时刻的彩色图像为C<sup>t</sup>,把彩色图像C<sup>t</sup>转换到HSI彩色空间表示,彩色图像C<sup>t</sup>的色调分量表示为<img file="FDA0000051444200000011.GIF" wi="83" he="55" />彩色图像C<sup>t</sup>的饱和度分量表示为<img file="FDA0000051444200000012.GIF" wi="70" he="55" />彩色图像C<sup>t</sup>的亮度分量表示为<img file="FDA0000051444200000013.GIF" wi="70" he="55" />采用Gabor方向滤波器对彩色图像C<sup>t</sup>的亮度分量<img file="FDA0000051444200000014.GIF" wi="46" he="54" />进行滤波,得到彩色图像C<sup>t</sup>在0°、45°、90°和135°四个方向的方向分量,分别记为<img file="FDA0000051444200000015.GIF" wi="506" he="55" />A2.对彩色图像C<sup>t</sup>的每一个图像分量<img file="FDA0000051444200000016.GIF" wi="76" he="54" />P∈{H,S,I,0°,45°,90°,135°},分别进行高斯金字塔运算,得到彩色图像C<sup>t</sup>的各个图像分量的不同层次的图像特征图<img file="FDA0000051444200000017.GIF" wi="142" he="54" />1≤n≤8,这里,<img file="FDA0000051444200000018.GIF" wi="893" he="62" />其中<img file="FDA0000051444200000019.GIF" wi="117" he="54" />为第n层高斯金字塔运算的结果,Gaussian是高斯函数卷积核,符号“*”表示卷积运算,SubSample[Image]表示对输入图像Image的水平和垂直方向均进行1/2下采样;当n=1时,<img file="FDA00000514442000000110.GIF" wi="176" he="54" />即为<img file="FDA00000514442000000111.GIF" wi="74" he="54" />A3.对于彩色图像C<sup>t</sup>的各个图像分量<img file="FDA00000514442000000112.GIF" wi="50" he="55" />计算其高斯金字塔不同层次的图像特征图的Center-Surround差异<img file="FDA00000514442000000113.GIF" wi="722" he="77" />其中,<img file="FDA00000514442000000114.GIF" wi="105" he="54" />和<img file="FDA00000514442000000115.GIF" wi="118" he="54" />分别表示彩色图像C<sup>t</sup>的图像分量<img file="FDA00000514442000000116.GIF" wi="52" he="54" />的高斯金字塔第i层和第j层的图像特征图,i∈{2,3,4},j=i+d,d∈{3,4};符号“Θ”表示将第j层的图像特征图<img file="FDA00000514442000000117.GIF" wi="118" he="54" />上采样到第i层的图像特征图<img file="FDA00000514442000000118.GIF" wi="106" he="55" />的尺寸大小,然后将这2幅图像特征图对应像素点进行相减,“|·|”表示取绝对值;A4.对于彩色图像C<sup>t</sup>的亮度分量<img file="FDA00000514442000000119.GIF" wi="71" he="55" />对其6幅Center-Surround差异计算结果<img file="FDA00000514442000000120.GIF" wi="1263" he="54" />进行Across-Scale融合,即<img file="FDA00000514442000000121.GIF" wi="508" he="102" />其中,<img file="FDA00000514442000000122.GIF" wi="59" he="46" />表示局部迭代归一化过程,若令M是局部迭代归一化过程的输入图像,则<img file="FDA00000514442000000123.GIF" wi="628" he="61" />这里DOG是高斯差分函数,c是一个常量,符号“*”表示卷积运算;符号<img file="FDA00000514442000000124.GIF" wi="109" he="41" />表示先将6幅Center-Surround差异 计算结果局部迭代归一化后得到的图像<img file="FDA0000051444200000021.GIF" wi="251" he="74" />均下采样到高斯金字塔中第4层图像特征图的尺寸大小,即长宽均为彩色图像C<sup>t</sup>长宽的1/16,然后将经上述处理后的6幅Center-Surround差异计算结果相加;对于彩色图像C<sup>t</sup>的色调分量<img file="FDA0000051444200000022.GIF" wi="54" he="53" />和饱和度分量<img file="FDA0000051444200000023.GIF" wi="70" he="54" />对其12幅Center-Surround差异计算结果<img file="FDA0000051444200000024.GIF" wi="829" he="54" /><img file="FDA0000051444200000025.GIF" wi="389" he="54" />以及<img file="FDA0000051444200000026.GIF" wi="1252" he="54" />进行Across-Scale融合,即<img file="FDA0000051444200000027.GIF" wi="889" he="102" />对于彩色图像C<sup>t</sup>的四个方向分量<img file="FDA0000051444200000028.GIF" wi="496" he="55" />对其24幅Center-Surround差异计算结果进行Across-Scale融合,即<img file="FDA0000051444200000029.GIF" wi="877" he="127" />A5.对Across-Scale融合的结果<img file="FDA00000514442000000210.GIF" wi="318" he="64" />分别进行线性归一化使<img file="FDA00000514442000000211.GIF" wi="224" he="64" /><img file="FDA00000514442000000212.GIF" wi="52" he="58" />中各个像素的值在0~255之间,记经过线性归一化后的<img file="FDA00000514442000000213.GIF" wi="318" he="63" />分别为A<sub>⊥</sub>、A<sub>H,S</sub>、A<sub>θ</sub>;②计算<img file="FDA00000514442000000214.GIF" wi="553" he="77" />其中,<img file="FDA00000514442000000215.GIF" wi="73" he="56" />和<img file="FDA00000514442000000216.GIF" wi="73" he="56" />分别为与彩色图像C<sup>t</sup>同一个视点的前一时刻t-1时刻和后一时刻t+1时刻的彩色图像C<sup>t-1</sup>和C<sup>t+1</sup>的亮度分量,符号“∩”表示图像与运算,“|·|”表示取绝对值;对<img file="FDA00000514442000000217.GIF" wi="50" he="45" />进行线性归一化使其各个像素的值在0~255之间;然后,对线性归一化后的<img file="FDA00000514442000000218.GIF" wi="50" he="44" />的水平和垂直方向均进行1/16下采样,得到运动视觉显著性图M;③计算得到深度视觉显著性图B,具体步骤为:C1.令<img file="FDA00000514442000000219.GIF" wi="50" he="54" />表示彩色图像C<sup>t</sup>所对应的深度图像,采用Gabor方向滤波器对深度图像<img file="FDA00000514442000000220.GIF" wi="51" he="55" />进行滤波,得到深度图像<img file="FDA00000514442000000221.GIF" wi="47" he="53" />的0°、45°、90°和135°四个方向的方向分量,分别记为<img file="FDA00000514442000000222.GIF" wi="347" he="54" />和<img file="FDA00000514442000000223.GIF" wi="112" he="54" />C2.对步骤C1得到的每一个图像分量<img file="FDA00000514442000000224.GIF" wi="80" he="55" />R∈{I,0°,45°,90°,135°},分别进行高斯金字塔运算,得到深度图像<img file="FDA00000514442000000225.GIF" wi="51" he="55" />的各个图像分量不同层次的图像特征图<img file="FDA00000514442000000226.GIF" wi="146" he="55" />1≤n≤8,这里,<img file="FDA00000514442000000227.GIF" wi="898" he="61" />其中<img file="FDA00000514442000000228.GIF" wi="122" he="54" />为第n层高斯金字塔运算的结果;当n=1时,<img file="FDA00000514442000000229.GIF" wi="181" he="54" />即为<img file="FDA00000514442000000230.GIF" wi="78" he="53" />C3.对于深度图像<img file="FDA00000514442000000231.GIF" wi="50" he="54" />的各个图像分量<img file="FDA00000514442000000232.GIF" wi="80" he="54" />计算其高斯金字塔不同层次的图像特征图的Center-Surround差异,即<img file="FDA00000514442000000233.GIF" wi="517" he="54" />其中<img file="FDA00000514442000000234.GIF" wi="111" he="54" />和<img file="FDA00000514442000000235.GIF" wi="120" he="54" />分别表示图像分量<img file="FDA00000514442000000236.GIF" wi="55" he="54" />的高斯金字塔第i层和第j层的图像特征图,i∈{2,3,4},j=i+d, d∈{3,4};符号“Θ”表示将第j层的图像特征图<img file="FDA0000051444200000031.GIF" wi="138" he="54" />上采样到第i层的图像特征图<img file="FDA0000051444200000032.GIF" wi="110" he="54" />的尺寸大小,然后将这2幅图像特征图对应像素点进行相减;C4.对于深度图像<img file="FDA0000051444200000033.GIF" wi="76" he="53" />对其6幅Center-Surround差异计算结果<img file="FDA0000051444200000034.GIF" wi="382" he="54" /><img file="FDA0000051444200000035.GIF" wi="1005" he="54" />进行Across-Scale融合,即<img file="FDA0000051444200000036.GIF" wi="513" he="102" />其中,<img file="FDA0000051444200000037.GIF" wi="59" he="46" />表示局部迭代归一化过程,符号<img file="FDA0000051444200000038.GIF" wi="109" he="41" />表示先将6幅Center-Surround差异计算结果局部迭代归一化后得到的图像<img file="FDA0000051444200000039.GIF" wi="256" he="74" />均下采样到高斯金字塔中第4层图像的尺寸大小,即长宽均为输入的深度图像长宽的1/16,然后将经上述处理后的6幅Center-Surround差异计算结果相加;对于四个方向分量<img file="FDA00000514442000000310.GIF" wi="222" he="55" /><img file="FDA00000514442000000311.GIF" wi="76" he="54" />和<img file="FDA00000514442000000312.GIF" wi="126" he="54" />对其24幅Center-Surround差异计算结果进行Across-Scale融合,即<img file="FDA00000514442000000313.GIF" wi="882" he="126" />C5.对Across-Scale融合的结果<img file="FDA00000514442000000314.GIF" wi="169" he="57" />分别进行线性归一化使<img file="FDA00000514442000000315.GIF" wi="170" he="57" />中各个像素的值在0~255之间,然后将线性归一化后的<img file="FDA00000514442000000316.GIF" wi="167" he="58" />进行线性加权融合,得到深度视觉显著性图B;④将静态视觉的亮度显著性图A<sub>I</sub>、颜色显著性图A<sub>H,S</sub>和方向显著性图A<sub>θ</sub>、运动视觉显著性图M、深度视觉显著性图B,按照VPV=αA<sub>⊥</sub>+βA<sub>H,S</sub>+γA<sub>θ</sub>+λM+ηB进行加权融合,得到输入的彩色图像C<sup>t</sup>的视觉显著性图VPV;视觉显著性图中每个像素的像素值vpv<sub>i</sub>为彩色图像C<sup>t</sup>对应的第i个16×16宏块的视觉优先权值,表征人眼对该宏块的关注度;α、β、γ、λ和η分别是亮度特征、颜色特征、方向特征、运动特征和深度特征的权重系数,表征人眼对这些特征的敏感程度;⑤对彩色图像C<sup>t</sup>进行编码,在编码时,根据彩色图像C<sup>t</sup>的视觉显著性图VPV调整彩色图像C<sup>t</sup>各个16×16宏块的编码量化参数:QP<sub>i</sub>=QP+ΔQP<sub>i</sub>,其中QP是由JMVM确定的对于彩色图像C<sup>t</sup>进行编码所采用的量化参数,QP<sub>i</sub>是编码彩色图像C<sup>t</sup>中第i个宏块时最终所采用的量化参数,<img file="FDA00000514442000000317.GIF" wi="987" he="139" />这里,<img file="FDA00000514442000000318.GIF" wi="912" he="197" /><img file="FDA00000514442000000319.GIF" wi="594" he="140" />是彩色图像C<sup>t</sup>的第i个16×16宏块的视觉优先权值,vpv<sub>max</sub>和vpv<sub>min</sub>分别为彩色图像C<sup>t</sup>的视觉显著性 图VPV中的最大值和最小值,α<sub>1</sub>、β<sub>1</sub>、α<sub>2</sub>、β<sub>2</sub>、γ<sub>2</sub>、ω<sub>2</sub>、α<sub>3</sub>、β<sub>3</sub>、γ<sub>3</sub>和μ为常数。
地址 315211 浙江省宁波市江北区风华路818号