发明名称 一种立体图像视觉舒适度评价方法
摘要 本发明公开了一种立体图像视觉舒适度评价方法,其在训练阶段,选取多对立体图像对构成偏好立体图像对组训练集,建立差分特征矢量与偏好值之间的支持向量回归训练模型;在测试阶段,计算测试立体图像与每对训练立体图像的差分特征矢量,并根据已训练得到的支持向量回归训练模型,预测得到每个差分特征矢量对应的偏好预测值,并最终得到测试立体图像的客观视觉舒适度评价预测值;优点是在训练阶段并不需要知道训练立体图像的主观评价值,得到的客观视觉舒适度评价预测值与主观评价值保持了较高的一致性。
申请公布号 CN104581141B 申请公布日期 2016.06.22
申请号 CN201510010148.8 申请日期 2015.01.09
申请人 宁波大学 发明人 邵枫;姜求平;李福
分类号 H04N17/00(2006.01)I;H04N13/00(2006.01)I 主分类号 H04N17/00(2006.01)I
代理机构 宁波奥圣专利代理事务所(普通合伙) 33226 代理人 周珏
主权项 一种立体图像视觉舒适度评价方法,包括训练阶段和测试阶段两个过程,其特征在于所述的训练阶段包括以下步骤:①‑1、平均选取五个不同舒适度等级的共M对立体图像对构成初始训练图像集,记为{S<sub>i</sub>|1≤i≤M},其中,M&gt;5,S<sub>i</sub>表示{S<sub>i</sub>|1≤i≤M}中的第i对立体图像对;①‑2、计算{S<sub>i</sub>|1≤i≤M}中的每对立体图像对的用于反映视觉舒适度的特征矢量,将{S<sub>i</sub>|1≤i≤M}中的第i对立体图像对的用于反映视觉舒适度的特征矢量记为F<sub>i</sub>,<img file="FDA0000932927640000011.GIF" wi="764" he="94" />其中,此处符号“[ ]”为矢量表示符号,χ<sub>i</sub>表示{S<sub>i</sub>|1≤i≤M}中的第i对立体图像对的左视点图像与右视点图像之间的视差图像中的所有像素点的视差范围,<img file="FDA0000932927640000012.GIF" wi="162" he="70" />和<img file="FDA0000932927640000019.GIF" wi="44" he="61" />对应表示{S<sub>i</sub>|1≤i≤M}中的第i对立体图像对的左视点图像与右视点图像之间的视差图像的交叉视差均值、非交叉视差均值和相对深度,<img file="FDA0000932927640000013.GIF" wi="59" he="68" />和<img file="FDA0000932927640000014.GIF" wi="55" he="62" />对应表示{S<sub>i</sub>|1≤i≤M}中的第i对立体图像对的左视点图像与右视点图像之间的视差图像的焦点深度图像的正焦点深度均值和负焦点深度均值,f<sub>i</sub>、τ<sub>i</sub>、υ<sub>i</sub>和<img file="FDA00009329276400000110.GIF" wi="40" he="53" />表示{S<sub>i</sub>|1≤i≤M}中的第i对立体图像对的左视点图像的边缘图像的与空间频率相关的四个特征,F<sub>i</sub>的维数为10;①‑3、从{S<sub>i</sub>|1≤i≤M}中随机选取1对舒适度高的立体图像对和1对舒适度低的立体图像对,构成一组正偏好立体图像对组和一组对应的负偏好立体图像对组,重复随机选取N次,这样共获得N组正偏好立体图像对组和N组负偏好立体图像对组,且每组正偏好立体图像对组与一组负偏好立体图像对组一一对应,将用于代表第j组正偏好立体图像对组的正偏好特征记为<img file="FDA00009329276400000112.GIF" wi="83" he="78" /><img file="FDA0000932927640000015.GIF" wi="303" he="95" />将用于代表第j组负偏好立体图像对组的负偏好特征记为<img file="FDA00009329276400000113.GIF" wi="81" he="78" /><img file="FDA00009329276400000111.GIF" wi="326" he="87" />再将N个正偏好特征和N个负偏好特征构成初始的偏好立体图像对组训练集,记为<img file="FDA00009329276400000114.GIF" wi="340" he="87" /><img file="FDA00009329276400000115.GIF" wi="299" he="94" />其中,从{S<sub>i</sub>|1≤i≤M}中随机选取的1对舒适度高的立体图像对与1对舒适度低的立体图像对两者的舒适度等级至少相差两级,N≥1,1≤j≤N,D<sub>j</sub>表示第j组正偏好立体图像对组中舒适度高的立体图像对的用于反映视觉舒适度的特征矢量<img file="FDA0000932927640000021.GIF" wi="94" he="85" />与舒适度低的立体图像对的用于反映视觉舒适度的特征矢量<img file="FDA0000932927640000022.GIF" wi="83" he="78" />的差分特征矢量,<img file="FDA0000932927640000023.GIF" wi="356" he="79" />L<sub>j</sub>表示第j组正偏好立体图像对组的偏好值,L<sub>j</sub>=+1,D<sub>j</sub>'表示第j组负偏好立体图像对组中舒适度低的立体图像对的用于反映视觉舒适度的特征矢量<img file="FDA0000932927640000024.GIF" wi="85" he="79" />与舒适度高的立体图像对的用于反映视觉舒适度的特征矢量<img file="FDA0000932927640000025.GIF" wi="94" he="79" />的差分特征矢量,<img file="FDA0000932927640000026.GIF" wi="362" he="80" />L<sub>j</sub>'表示第j组负偏好立体图像对组的偏好值,L<sub>j</sub>'=‑1;①‑4、从<img file="FDA0000932927640000027.GIF" wi="307" he="95" />中随机选择T/2个正偏好特征,排除与已选择的正偏好特征相对应的负偏好特征,从剩余的所有负偏好特征中随机选择T/2个负偏好特征,将选择的T/2个正偏好特征和T/2个负偏好特征构成偏好立体图像对组训练集,记为<img file="FDA0000932927640000028.GIF" wi="312" he="100" />其中,T取区间[2,N]内的偶数,<img file="FDA0000932927640000029.GIF" wi="52" he="78" />表示<img file="FDA00009329276400000210.GIF" wi="277" he="95" />中的第t个特征,<img file="FDA00009329276400000211.GIF" wi="51" he="76" />为正偏好特征或为负偏好特征,<maths num="0001"><math><![CDATA[<mrow><msub><mover><mi>S</mi><mo>~</mo></mover><mi>t</mi></msub><mo>=</mo><mo>{</mo><msub><mover><mi>D</mi><mo>~</mo></mover><mi>t</mi></msub><mo>,</mo><msub><mover><mi>L</mi><mo>~</mo></mover><mi>t</mi></msub><mo>}</mo><mo>,</mo></mrow>]]></math><img file="FDA00009329276400000212.GIF" wi="285" he="95" /></maths><img file="FDA00009329276400000213.GIF" wi="57" he="77" />表示<maths num="0002"><math><![CDATA[<mrow><mo>{</mo><msub><mover><mi>S</mi><mo>~</mo></mover><mi>t</mi></msub><mo>|</mo><mn>1</mn><mo>&le;</mo><mi>t</mi><mo>&le;</mo><mi>T</mi><mo>}</mo></mrow>]]></math><img file="FDA00009329276400000214.GIF" wi="279" he="94" /></maths>中的第t个特征<img file="FDA00009329276400000215.GIF" wi="47" he="78" />代表的一组正偏好立体图像对组或代表的一组负偏好立体图像对组所对应的差分特征矢量,<img file="FDA00009329276400000216.GIF" wi="52" he="79" />表示<img file="FDA00009329276400000217.GIF" wi="279" he="103" />中的第t个特征<img file="FDA00009329276400000218.GIF" wi="46" he="77" />代表的一组正偏好立体图像对组或代表的一组负偏好立体图像对组的偏好值,<img file="FDA00009329276400000219.GIF" wi="279" he="87" />①‑5、采用支持向量回归,对<img file="FDA00009329276400000220.GIF" wi="284" he="95" />中的所有差分特征矢量进行训练,并使得经过训练得到的回归函数值与偏好值之间的误差最小,得到最优的权重矢量w<sup>opt</sup>和最优的偏置项b<sup>opt</sup>,然后利用得到的最优的权重矢量w<sup>opt</sup>和最优的偏置项b<sup>opt</sup>构造支持向量回归训练模型,记为f(D<sub>inp</sub>),<img file="FDA00009329276400000221.GIF" wi="615" he="77" />其中,D<sub>inp</sub>表示支持向量回归训练模型的输入矢量,(w<sup>opt</sup>)<sup>T</sup>为w<sup>opt</sup>的转置矢量,<img file="FDA00009329276400000222.GIF" wi="154" he="68" />表示支持向量回归训练模型的输入矢量D<sub>inp</sub>的线性函数;所述的测试阶段包括以下步骤:②对于任意一对测试立体图像对S<sub>test</sub>,按照步骤①‑2的过程,以相同的操作获取S<sub>test</sub>的用于反映视觉舒适度的特征矢量,记为F<sub>test</sub>;然后计算F<sub>test</sub>与{S<sub>i</sub>|1≤i≤M}中的每对立体图像对的用于反映视觉舒适度的特征矢量的差分特征矢量;接着根据训练阶段构造的支持向量回归训练模型f(D<sub>inp</sub>),通过对F<sub>test</sub>与{S<sub>i</sub>|1≤i≤M}中的每对立体图像对的用于反映视觉舒适度的特征矢量的差分特征矢量进行测试,获取S<sub>test</sub>的客观视觉舒适度评价预测值,记为Q<sub>test</sub>;所述的步骤②的具体过程为:②‑1、按照步骤①‑2的过程,以相同的操作获取S<sub>test</sub>的用于反映视觉舒适度的特征矢量,记为F<sub>test</sub>,F<sub>test</sub>的维数为10;②‑2、计算F<sub>test</sub>与{S<sub>i</sub>|1≤i≤M}中的每对立体图像对的用于反映视觉舒适度的特征矢量的差分特征矢量,将F<sub>test</sub>与F<sub>i</sub>的差分特征矢量记为D<sub>i,test</sub>,D<sub>i,test</sub>=F<sub>test</sub>‑F<sub>i</sub>;②‑3、根据训练阶段构造的支持向量回归训练模型f(D<sub>inp</sub>),对F<sub>test</sub>与{S<sub>i</sub>|1≤i≤M}中的每对立体图像对的用于反映视觉舒适度的特征矢量的差分特征矢量进行测试,预测得到每个差分特征矢量对应的偏好预测值,将D<sub>i,test</sub>对应的偏好预测值记为L<sub>i,test</sub>,L<sub>i,test</sub>=f(D<sub>i,test</sub>),<img file="FDA0000932927640000031.GIF" wi="658" he="78" />其中,<img file="FDA0000932927640000032.GIF" wi="172" he="71" />表示支持向量回归训练模型的输入矢量D<sub>i,test</sub>的线性函数;②‑4、计算S<sub>test</sub>的偏好预测值,记为L<sub>test</sub>,<img file="FDA0000932927640000033.GIF" wi="293" he="167" />②‑5、计算S<sub>test</sub>的客观视觉舒适度评价预测值,记为Q<sub>test</sub>,<img file="FDA0000932927640000034.GIF" wi="476" he="125" />
地址 315211 浙江省宁波市江北区风华路818号