发明名称 一种无参考模糊失真立体图像质量评价方法
摘要 本发明公开了一种无参考模糊失真立体图像质量评价方法,其在训练阶段,选择多幅无失真立体图像和对应的模糊失真立体图像构成训练图像集,然后采用Fast‑ICA方法进行字典训练操作,构造训练图像集中的每幅图像的视觉字典表;通过计算每副无失真立体图像和对应的模糊失真立体图像的视觉字典表之间的距离,构造每副失真立体图像的视觉字典表的视觉质量表;在测试阶段,对于任意一副测试立体图像,对测试立体图像的左视点图像和右视点图像进行非重叠的分块处理,然后根据已构造的视觉字典表和视觉质量表,获取测试立体图像的图像质量客观评价预测值;优点是计算复杂度低,且客观评价结果与主观感知的相关性好。
申请公布号 CN104036502B 申请公布日期 2016.08.24
申请号 CN201410245174.4 申请日期 2014.06.03
申请人 宁波大学 发明人 邵枫;王珊珊;李柯蒙
分类号 G06T7/00(2006.01)I;G06K9/66(2006.01)I 主分类号 G06T7/00(2006.01)I
代理机构 宁波奥圣专利代理事务所(普通合伙) 33226 代理人 周珏
主权项 一种无参考模糊失真立体图像质量评价方法,其特征在于包括训练阶段和测试阶段两个过程,其中,训练阶段包括以下步骤:①‑1、选取N幅原始的无失真立体图像,然后将选取的N幅原始的无失真立体图像和每幅原始的无失真立体图像对应的模糊失真立体图像构成训练图像集,记为{S<sub>i,org</sub>,S<sub>i,dis</sub>|1≤i≤N},其中,S<sub>i,org</sub>表示{S<sub>i,org</sub>,S<sub>i,dis</sub>|1≤i≤N}中的第i幅原始的无失真立体图像,S<sub>i,dis</sub>表示{S<sub>i,org</sub>,S<sub>i,dis</sub>|1≤i≤N}中的第i幅原始的无失真立体图像对应的模糊失真立体图像;①‑2、对{S<sub>i,org</sub>,S<sub>i,dis</sub>|1≤i≤N}中的每幅模糊失真立体图像的左视点图像进行非重叠的分块处理,然后采用Fast‑ICA方法对由每幅模糊失真立体图像的左视点图像中的所有子块构成的集合进行字典训练操作,得到每幅模糊失真立体图像的左视点图像的视觉字典表,将S<sub>i,dis</sub>的左视点图像的视觉字典表记为<img file="FDA00005151908300000110.GIF" wi="128" he="73" />其中,<img file="FDA00005151908300000111.GIF" wi="105" he="81" />的维数为64×K,K表示<img file="FDA00005151908300000112.GIF" wi="105" he="73" />中包含的视觉字典的总个数;对{S<sub>i,org</sub>,S<sub>i,dis</sub>|1≤i≤N}中的每幅模糊失真立体图像的右视点图像进行非重叠的分块处理;然后采用Fast‑ICA方法对由每幅模糊失真立体图像的右视点图像中的所有子块构成的集合进行字典训练操作,得到每幅模糊失真立体图像的右视点图像的视觉字典表,将S<sub>i,dis</sub>的右视点图像的视觉字典表记为<img file="FDA0000515190830000011.GIF" wi="145" he="81" />其中,<img file="FDA0000515190830000012.GIF" wi="117" he="81" />的维数为64×K,K表示<img file="FDA0000515190830000013.GIF" wi="114" he="81" />中包含的视觉字典的总个数,与<img file="FDA0000515190830000014.GIF" wi="110" he="81" />中包含的视觉字典的总个数一致;对{S<sub>i,org</sub>,S<sub>i,dis</sub>|1≤i≤N}中的每幅原始的无失真立体图像的左视点图像进行非重叠的分块处理;然后采用Fast‑ICA方法对由每幅原始的无失真立体图像的左视点图像中的所有子块构成的集合进行字典训练操作,得到每幅原始的无失真立体图像的左视点图像的视觉字典表,将S<sub>i,org</sub>的左视点图像的视觉字典表记为<img file="FDA0000515190830000015.GIF" wi="146" he="82" />其中,<img file="FDA0000515190830000016.GIF" wi="114" he="82" />的维数为64×K,K表示<img file="FDA0000515190830000017.GIF" wi="114" he="81" />中包含的视觉字典的总个数,与<img file="FDA0000515190830000018.GIF" wi="106" he="82" />和<img file="FDA0000515190830000019.GIF" wi="110" he="80" />中各自包含的视觉字典的总个数一致;对{S<sub>i,org</sub>,S<sub>i,dis</sub>|1≤i≤N}中的每幅原始的无失真立体图像的右视点图像进行非重叠的分块处理;然后采用Fast‑ICA方法对由每幅原始的无失真立体图像的右视点图像中的所有子块构成的集合进行字典训练操作,得到每幅原始的无失真立体图像的右视点图像的视觉字典表,将S<sub>i,org</sub>的右视点图像的视觉字典表记为<img file="FDA0000515190830000021.GIF" wi="144" he="82" />其中,<img file="FDA0000515190830000022.GIF" wi="126" he="82" />的维数为64×K,K表示<img file="FDA0000515190830000023.GIF" wi="121" he="78" />中包含的视觉字典的总个数,与<img file="FDA0000515190830000024.GIF" wi="135" he="81" /><img file="FDA0000515190830000025.GIF" wi="115" he="81" />和<img file="FDA0000515190830000026.GIF" wi="108" he="82" />中各自包含的视觉字典的总个数一致;①‑3、通过计算{S<sub>i,org</sub>,S<sub>i,dis</sub>|1≤i≤N}中的每幅原始的无失真立体图像的左视点图像的视觉字典表与对应的模糊失真立体图像的左视点图像的视觉字典表之间的距离,获取{S<sub>i,org</sub>,S<sub>i,dis</sub>|1≤i≤N}中的每幅模糊失真立体图像的左视点图像的视觉字典表的视觉质量表,将S<sub>i,dis</sub>的左视点图像的视觉字典表<img file="FDA0000515190830000027.GIF" wi="115" he="81" />的视觉质量表记为<img file="FDA0000515190830000028.GIF" wi="115" he="75" /><maths num="0001"><math><![CDATA[<mrow><msubsup><mi>Q</mi><mi>L</mi><mi>i</mi></msubsup><mo>=</mo><mo>{</mo><msubsup><mi>q</mi><mi>L</mi><mrow><mi>i</mi><mo>,</mo><mi>k</mi></mrow></msubsup><mo>|</mo><mn>1</mn><mo>&le;</mo><mi>k</mi><mo>&le;</mo><mi>K</mi><mo>}</mo><mo>,</mo><msubsup><mi>q</mi><mi>L</mi><mrow><mi>i</mi><mo>,</mo><mi>k</mi></mrow></msubsup><mo>=</mo><mfrac><mn>1</mn><mrow><mn>1</mn><mo>+</mo><mn>6</mn><mo>&times;</mo><msup><mrow><mo>(</mo><mo>|</mo><mo>|</mo><msubsup><mi>g</mi><mrow><mi>L</mi><mo>,</mo><mi>dis</mi></mrow><mrow><mi>i</mi><mo>,</mo><mi>k</mi></mrow></msubsup><mo>-</mo><msubsup><mi>g</mi><mrow><mi>L</mi><mo>,</mo><mi>org</mi></mrow><mrow><mi>i</mi><mo>,</mo><mi>k</mi></mrow></msubsup><msup><mrow><mo>|</mo><mo>|</mo></mrow><msub><mi>C</mi><mn>1</mn></msub></msup><mo>&times;</mo><msup><mrow><mo>(</mo><mi>arccos</mi><mrow><mo>(</mo><mfrac><mrow><mo>&lt;</mo><msubsup><mi>g</mi><mrow><mi>L</mi><mo>,</mo><mi>dis</mi></mrow><mrow><mi>i</mi><mo>,</mo><mi>k</mi></mrow></msubsup><mo>,</mo><mo>></mo><msubsup><mi>g</mi><mrow><mi>L</mi><mo>,</mo><mi>org</mi></mrow><mrow><mi>i</mi><mo>,</mo><mi>k</mi></mrow></msubsup></mrow><mrow><mo>|</mo><mo>|</mo><msubsup><mi>g</mi><mrow><mi>L</mi><mo>,</mo><mi>dis</mi></mrow><mrow><mi>i</mi><mo>,</mo><mi>k</mi></mrow></msubsup><mo>|</mo><mo>|</mo><mo>&CenterDot;</mo><mo>|</mo><mo>|</mo><msubsup><mi>g</mi><mrow><mi>L</mi><mo>,</mo><mi>org</mi></mrow><mrow><mi>i</mi><mo>,</mo><mi>k</mi></mrow></msubsup><mo>|</mo><mo>|</mo></mrow></mfrac><mo>)</mo></mrow><mo>)</mo></mrow><msub><mi>C</mi><mn>2</mn></msub></msup><mo>)</mo></mrow><mrow><mo>-</mo><mn>2</mn></mrow></msup></mrow></mfrac><mo>,</mo></mrow>]]></math><img file="FDA0000515190830000029.GIF" wi="1754" he="290" /></maths>其中,<img file="FDA00005151908300000210.GIF" wi="76" he="78" />表示<img file="FDA00005151908300000211.GIF" wi="100" he="76" />中的第k个视觉字典的视觉质量,符号“||||”为求欧氏距离符号,arccos()为取反余弦函数,符号“<>”为求内积符号,C<sub>1</sub>和C<sub>2</sub>为控制参数,<img file="FDA00005151908300000212.GIF" wi="99" he="83" />表示<img file="FDA00005151908300000213.GIF" wi="110" he="81" />中的第k个视觉字典,<img file="FDA00005151908300000214.GIF" wi="102" he="82" />的维数为64×1,<img file="FDA00005151908300000215.GIF" wi="109" he="83" />表示<img file="FDA00005151908300000216.GIF" wi="120" he="82" />中的第k个视觉字典,<img file="FDA00005151908300000217.GIF" wi="104" he="75" />的维数为64×1,<img file="FDA00005151908300000225.GIF" wi="65" he="68" />的维数为1×K;通过计算{S<sub>i,org</sub>,S<sub>i,dis</sub>|1≤i≤N}中的每幅原始的无失真立体图像的右视点图像的视觉字典表与对应的模糊失真立体图像的右视点图像的视觉字典表之间的距离,获取{S<sub>i,org</sub>,S<sub>i,dis</sub>|1≤i≤N}中的每幅模糊失真立体图像的右视点图像的视觉字典表的视觉质量表,将S<sub>i,dis</sub>的右视点图像的视觉字典表<img file="FDA00005151908300000218.GIF" wi="115" he="81" />的视觉质量表记为<img file="FDA00005151908300000219.GIF" wi="115" he="75" /><maths num="0002"><math><![CDATA[<mrow><msubsup><mi>Q</mi><mi>R</mi><mi>i</mi></msubsup><mo>=</mo><mo>{</mo><msubsup><mi>q</mi><mi>R</mi><mrow><mi>i</mi><mo>,</mo><mi>k</mi></mrow></msubsup><mo>|</mo><mn>1</mn><mo>&le;</mo><mi>k</mi><mo>&le;</mo><mi>K</mi><mo>}</mo><mo>,</mo><msubsup><mi>q</mi><mi>R</mi><mrow><mi>i</mi><mo>,</mo><mi>k</mi></mrow></msubsup><mo>=</mo><mfrac><mn>1</mn><mrow><mn>1</mn><mo>+</mo><mn>6</mn><mo>&times;</mo><msup><mrow><mo>(</mo><mo>|</mo><mo>|</mo><msubsup><mi>g</mi><mrow><mi>R</mi><mo>,</mo><mi>dis</mi></mrow><mrow><mi>i</mi><mo>,</mo><mi>k</mi></mrow></msubsup><mo>-</mo><msubsup><mi>g</mi><mrow><mi>R</mi><mo>,</mo><mi>org</mi></mrow><mrow><mi>i</mi><mo>,</mo><mi>k</mi></mrow></msubsup><msup><mrow><mo>|</mo><mo>|</mo></mrow><msub><mi>C</mi><mn>1</mn></msub></msup><mo>&times;</mo><msup><mrow><mo>(</mo><mi>arccos</mi><mrow><mo>(</mo><mfrac><mrow><mo>&lt;</mo><msubsup><mi>g</mi><mrow><mi>R</mi><mo>,</mo><mi>dis</mi></mrow><mrow><mi>i</mi><mo>,</mo><mi>k</mi></mrow></msubsup><mo>,</mo><mo>></mo><msubsup><mi>g</mi><mrow><mi>R</mi><mo>,</mo><mi>org</mi></mrow><mrow><mi>i</mi><mo>,</mo><mi>k</mi></mrow></msubsup></mrow><mrow><mo>|</mo><mo>|</mo><msubsup><mi>g</mi><mrow><mi>R</mi><mo>,</mo><mi>dis</mi></mrow><mrow><mi>i</mi><mo>,</mo><mi>k</mi></mrow></msubsup><mo>|</mo><mo>|</mo><mo>&CenterDot;</mo><mo>|</mo><mo>|</mo><msubsup><mi>g</mi><mrow><mi>R</mi><mo>,</mo><mi>org</mi></mrow><mrow><mi>i</mi><mo>,</mo><mi>k</mi></mrow></msubsup><mo>|</mo><mo>|</mo></mrow></mfrac><mo>)</mo></mrow><mo>)</mo></mrow><msub><mi>C</mi><mn>2</mn></msub></msup><mo>)</mo></mrow><mrow><mo>-</mo><mn>2</mn></mrow></msup></mrow></mfrac><mo>,</mo></mrow>]]></math><img file="FDA00005151908300000220.GIF" wi="1763" he="290" /></maths>其中,<img file="FDA00005151908300000221.GIF" wi="76" he="78" />表示<img file="FDA00005151908300000222.GIF" wi="115" he="81" />中的第k个视觉字典的视觉质量,<img file="FDA00005151908300000223.GIF" wi="105" he="81" />表示<img file="FDA00005151908300000224.GIF" wi="106" he="81" />中的第k个视觉字典,<img file="FDA0000515190830000031.GIF" wi="108" he="82" />的维数为64×1,<img file="FDA0000515190830000032.GIF" wi="116" he="83" />表示<img file="FDA0000515190830000033.GIF" wi="123" he="87" />中的第k个视觉字典,<img file="FDA0000515190830000034.GIF" wi="114" he="83" />的维数为64×1,<img file="FDA0000515190830000035.GIF" wi="76" he="75" />的维数为1×K;测试阶段包括以下步骤:②对于任意一副测试立体图像S<sub>test</sub>,分别对S<sub>test</sub>的左视点图像和右视点图像进行非重叠的分块处理;然后根据{S<sub>i,org</sub>,S<sub>i,dis</sub>|1≤i≤N}中的每幅原始的无失真立体图像的左视点图像的视觉字典表、对应的模糊失真立体图像的左视点图像的视觉字典表及其视觉质量表,计算S<sub>test</sub>的左视点图像中的每个子块的客观评价度量值,同样根据{S<sub>i,org</sub>,S<sub>i,dis</sub>|1≤i≤N}中的每幅原始的无失真立体图像的右视点图像的视觉字典表、对应的模糊失真立体图像的右视点图像的视觉字典表及其视觉质量表,计算S<sub>test</sub>的右视点图像中的每个子块的客观评价度量值;再根据S<sub>test</sub>的左视点图像和右视点图像中的每个子块的客观评价度量值,获取S<sub>test</sub>的图像质量客观评价预测值。
地址 315211 浙江省宁波市江北区风华路818号