发明名称 一种立体图像显著图提取方法
摘要 本发明公开了一种立体图像显著图提取方法,其在训练阶段,提取多幅训练立体图像的右视点图像中的每个区域的对比度特征矢量、通用特征矢量和背景先验特征矢量,并融合得到每幅立体图像的右视点图像中的每个区域的用于反映视觉显著性的特征矢量,建立特征矢量与平均眼动值之间的随机森林回归训练模型;在测试阶段,计算测试立体图像的右视点图像中的每个区域的用于反映视觉显著性的特征矢量,并根据已训练得到的随机森林回归训练模型,预测得到测试立体图像的三维显著图;优点是所提取的特征能够较好地反映各种因素的显著变化情况,从而有效地提高了视觉显著值的预测准确性。
申请公布号 CN104822058B 申请公布日期 2016.08.17
申请号 CN201510173098.5 申请日期 2015.04.14
申请人 宁波大学 发明人 邵枫;姜求平;李福
分类号 H04N13/00(2006.01)I 主分类号 H04N13/00(2006.01)I
代理机构 宁波奥圣专利代理事务所(普通合伙) 33226 代理人 周珏
主权项 一种立体图像显著图提取方法,其特征在于包括训练阶段和测试阶段两个过程,所述的训练阶段的具体步骤如下:①‑1、将选取的N副各不相同的立体图像以及每幅立体图像的右视差图像构成一个集合,记为{L<sub>i</sub>,R<sub>i</sub>,d<sub>i</sub>|1≤i≤N},其中,N≥1,L<sub>i</sub>表示{L<sub>i</sub>,R<sub>i</sub>,d<sub>i</sub>|1≤i≤N}中的第i幅立体图像的左视点图像,R<sub>i</sub>表示{L<sub>i</sub>,R<sub>i</sub>,d<sub>i</sub>|1≤i≤N}中的第i幅立体图像的右视点图像,d<sub>i</sub>表示{L<sub>i</sub>,R<sub>i</sub>,d<sub>i</sub>|1≤i≤N}中的第i幅立体图像的右视差图像;①‑2、采用超像素分割技术将{L<sub>i</sub>,R<sub>i</sub>,d<sub>i</sub>|1≤i≤N}中的每幅立体图像的右视点图像分割成M个互不重叠的区域,将R<sub>i</sub>中的第h个区域记为SP<sub>i,h</sub>,其中,M≥1,1≤h≤M;①‑3、计算{L<sub>i</sub>,R<sub>i</sub>,d<sub>i</sub>|1≤i≤N}中的每幅立体图像的右视点图像中的每个区域的对比度特征矢量,将R<sub>i</sub>中的第h个区域SP<sub>i,h</sub>的对比度特征矢量记为<img file="FDA0000698521690000011.GIF" wi="123" he="62" /><img file="FDA0000698521690000012.GIF" wi="827" he="106" />其中,<img file="FDA0000698521690000013.GIF" wi="84" he="63" />的维数为36,此处符号“[]”为矢量表示符号,d<sub>i,h</sub>表示SP<sub>i,h</sub>的第一特征矢量u<sub>i,h</sub>与相邻区域的第一特征矢量的距离,<img file="FDA0000698521690000014.GIF" wi="448" he="99" />f<sub>i,h</sub>的维数为20,f<sub>i,h</sub>表示SP<sub>i,h</sub>中的所有像素点的频率响应特征矢量的均值,c<sub>i,h</sub>的维数为9,c<sub>i,h</sub>表示SP<sub>i,h</sub>中的所有像素点的颜色特征矢量的均值,<img file="FDA0000698521690000015.GIF" wi="63" he="67" />表示SP<sub>i,h</sub>的视差幅值的均值,<img file="FDA0000698521690000016.GIF" wi="71" he="70" />表示SP<sub>i,h</sub>中的所有像素点在RGB颜色空间的R分量、G分量和B分量的颜色直方图与SP<sub>i,h</sub>的相邻区域中的所有像素点在RGB颜色空间的R分量、G分量和B分量的颜色直方图的距离,<img file="FDA0000698521690000017.GIF" wi="70" he="70" />表示SP<sub>i,h</sub>中的所有像素点在CIELAB颜色空间的L分量、a分量和b分量的颜色直方图与SP<sub>i,h</sub>的相邻区域中的所有像素点在CIELAB颜色空间的L分量、a分量和b分量的颜色直方图的距离,<img file="FDA0000698521690000018.GIF" wi="70" he="69" />表示SP<sub>i,h</sub>中的所有像素点在HVS颜色空间的H分量的颜色直方图与SP<sub>i,h</sub>的相邻区域中的所有像素点在HVS颜色空间的H分量的颜色直方图的距离,<img file="FDA0000698521690000019.GIF" wi="67" he="68" />表示SP<sub>i,h</sub>中的所有像素点在HVS 颜色空间的S分量的颜色直方图与SP<sub>i,h</sub>的相邻区域中的所有像素点在HVS颜色空间的S分量的颜色直方图的距离,<img file="FDA0000698521690000021.GIF" wi="69" he="67" />表示SP<sub>i,h</sub>中的所有像素点的LBP特征统计直方图与SP<sub>i,h</sub>的相邻区域中的所有像素点的LBP特征统计直方图的距离,<img file="FDA0000698521690000022.GIF" wi="67" he="69" />表示SP<sub>i,h</sub>中的所有像素点的视差统计直方图与SP<sub>i,h</sub>的相邻区域中的所有像素点的视差统计直方图的距离,此处的相邻区域是指R<sub>i</sub>中与SP<sub>i,h</sub>相邻的区域;①‑4、计算{L<sub>i</sub>,R<sub>i</sub>,d<sub>i</sub>|1≤i≤N}中的每幅立体图像的右视点图像中的每个区域的通用特征矢量,将R<sub>i</sub>中的第h个区域SP<sub>i,h</sub>的通用特征矢量记为<img file="FDA0000698521690000023.GIF" wi="127" he="63" /><img file="FDA0000698521690000024.GIF" wi="621" he="104" />其中,<img file="FDA0000698521690000025.GIF" wi="81" he="60" />的维数为33,此处符号“[]”为矢量表示符号,<img file="FDA0000698521690000026.GIF" wi="51" he="69" />的维数为20,<img file="FDA0000698521690000027.GIF" wi="51" he="70" />表示SP<sub>i,h</sub>中的所有像素点的频率响应特征矢量的方差,<img file="FDA0000698521690000028.GIF" wi="57" he="60" />的维数为9,<img file="FDA0000698521690000029.GIF" wi="58" he="58" />表示SP<sub>i,h</sub>中的所有像素点的颜色特征矢量的方差,<img file="FDA00006985216900000210.GIF" wi="64" he="72" />表示SP<sub>i,h</sub>的视差幅值的方差,x<sub>i,h</sub>的维数为2,x<sub>i,h</sub>表示SP<sub>i,h</sub>的中心像素点的坐标位置,s<sub>i,h</sub>表示SP<sub>i,h</sub>的面积;①‑5、计算{L<sub>i</sub>,R<sub>i</sub>,d<sub>i</sub>|1≤i≤N}中的每幅立体图像的右视点图像中的每个区域的背景先验特征矢量,将R<sub>i</sub>中的第h个区域SP<sub>i,h</sub>的背景先验特征矢量记为<img file="FDA00006985216900000211.GIF" wi="133" he="88" /><img file="FDA00006985216900000212.GIF" wi="775" he="107" />其中,<img file="FDA00006985216900000213.GIF" wi="79" he="68" />的维数为36,此处符号“[]”为矢量表示符号,e<sub>i,h</sub>表示SP<sub>i,h</sub>的第一特征矢量u<sub>i,h</sub>与背景区域的第一特征矢量的距离,<img file="FDA00006985216900000214.GIF" wi="448" he="97" />f<sub>i,h</sub>的维数为20,f<sub>i,h</sub>表示SP<sub>i,h</sub>中的所有像素点的频率响应特征矢量的均值,c<sub>i,h</sub>的维数为9,c<sub>i,h</sub>表示SP<sub>i,h</sub>中的所有像素点的颜色特征矢量的均值,<img file="FDA00006985216900000215.GIF" wi="67" he="66" />表示SP<sub>i,h</sub>的视差幅值的均值,<img file="FDA00006985216900000216.GIF" wi="65" he="72" />表示SP<sub>i,h</sub>中的所有像素点在RGB颜色空间的R分量、G分量和B分量的颜色直方图与R<sub>i</sub>中的背景区域中的所有像素点在RGB颜色空间的R分量、G分量和B分量的颜色直方图的距离,<img file="FDA00006985216900000217.GIF" wi="65" he="69" />表示SP<sub>i,h</sub>中的所有像素点在CIELAB颜色空间的L分量、a分量和b分量的颜色直方图与R<sub>i</sub>中的背景区域中的所有像素点在CIELAB 颜色空间的L分量、a分量和b分量的颜色直方图的距离,<img file="FDA0000698521690000031.GIF" wi="63" he="71" />表示SP<sub>i,h</sub>中的所有像素点在HVS颜色空间的H分量的颜色直方图与R<sub>i</sub>中的背景区域中的所有像素点在HVS颜色空间的H分量的颜色直方图的距离,<img file="FDA0000698521690000032.GIF" wi="61" he="70" />表示SP<sub>i,h</sub>中的所有像素点在HVS颜色空间的S分量的颜色直方图与R<sub>i</sub>中的背景区域中的所有像素点在HVS颜色空间的S分量的颜色直方图的距离,<img file="FDA0000698521690000033.GIF" wi="63" he="72" />表示SP<sub>i,h</sub>中的所有像素点的LBP特征统计直方图与R<sub>i</sub>中的背景区域中的所有像素点的LBP特征统计直方图的距离,<img file="FDA0000698521690000034.GIF" wi="60" he="73" />表示SP<sub>i,h</sub>中的所有像素点的视差统计直方图与R<sub>i</sub>中的背景区域中的所有像素点的视差统计直方图的距离,此处的背景区域是指R<sub>i</sub>中位于最左边、最右边、最上边、最下边的区域;①‑6、将{L<sub>i</sub>,R<sub>i</sub>,d<sub>i</sub>|1≤i≤N}中的每幅立体图像的右视点图像中的每个区域的对比度特征矢量、通用特征矢量和背景先验特征矢量按顺序进行排列,构成{L<sub>i</sub>,R<sub>i</sub>,d<sub>i</sub>|1≤i≤N}中的每幅立体图像的右视点图像中的每个区域的用于反映视觉显著性的特征矢量,将R<sub>i</sub>中的第h个区域SP<sub>i,h</sub>的用于反映视觉显著性的特征矢量记为X<sub>i,h</sub>,<img file="FDA0000698521690000035.GIF" wi="475" he="99" />其中,X<sub>i,h</sub>的维数为105,此处符号“[]”为矢量表示符号;①‑7、采用随机森林回归,对{L<sub>i</sub>,R<sub>i</sub>,d<sub>i</sub>|1≤i≤N}中的所有立体图像的右视点图像中的所有区域的用于反映视觉显著性的特征矢量进行训练,并使得经过训练得到的回归函数值与平均眼动值之间的误差最小,得到最优的随机森林回归训练模型,记为f(D<sub>inp</sub>),其中,f()为函数表示形式,D<sub>inp</sub>表示随机森林回归训练模型的输入矢量;所述的测试阶段的具体步骤如下:②‑1、对于任意一副测试立体图像S<sub>test</sub>,将S<sub>test</sub>的左视点图像、右视点图像、右视差图像对应记为L<sub>test</sub>、R<sub>test</sub>、d<sub>test</sub>;然后采用超像素分割技术将R<sub>test</sub>分割成M个互不重叠的区域,将R<sub>test</sub>中的第h个区域记为SP<sub>h</sub>';其中,M≥1,1≤h≤M;②‑2、按照步骤①‑3至步骤①‑6的过程,以相同的操作方式获取R<sub>test</sub>中的每个区域 的用于反映视觉显著性的特征矢量,将R<sub>test</sub>中的第h个区域SP<sub>h</sub>'的用于反映视觉显著性的特征矢量记为F<sub>test,h</sub>;然后根据训练阶段得到的最优的随机森林回归训练模型f(D<sub>inp</sub>),将F<sub>test,h</sub>作为最优的随机森林回归训练模型的输入矢量,获取R<sub>test</sub>中的每个区域的三维视觉显著值,将R<sub>test</sub>中的第h个区域SP<sub>h</sub>'的三维视觉显著值记为S<sub>3D,h</sub>,S<sub>3D,h</sub>=f(F<sub>test,h</sub>);再将R<sub>test</sub>中的每个区域的三维视觉显著值作为对应区域中的所有像素点的显著值,从而得到R<sub>test</sub>的三维显著图,记为{S<sub>3D</sub>(x,y)},其中,此处(x,y)表示S<sub>test</sub>中的像素点的坐标位置,1≤x≤W,1≤y≤H,W和H对应表示S<sub>test</sub>的宽度和高度,S<sub>3D</sub>(x,y)表示{S<sub>3D</sub>(x,y)}中坐标位置为(x,y)的像素点的像素值。
地址 315211 浙江省宁波市江北区风华路818号