发明名称 一种针对模糊失真立体图像的无参考质量评价方法
摘要 本发明公开了一种针对模糊失真立体图像的无参考质量评价方法,其在训练阶段,选择多幅无失真立体图像和对应的模糊失真立体图像构成训练图像集,采用二维经验模式分解对模糊失真立体图像进行分解得到内蕴模式函数图像,并采用K均值聚类方法构造视觉字典表;通过获取模糊失真立体图像中的像素点的客观评价度量值,构造视觉质量表;在测试阶段,采用二维经验模式分解对测试立体图像进行分解得到内蕴模式函数图像,然后根据视觉字典表和视觉质量表,得到测试图像的图像质量客观评价预测值;优点是在训练阶段不需要复杂的机器学训练过程,在测试阶段只需通过简单的视觉字典搜索过程就能得到图像质量客观评价预测值,且与主观评价值的一致性较好。
申请公布号 CN103914835A 申请公布日期 2014.07.09
申请号 CN201410104299.5 申请日期 2014.03.20
申请人 宁波大学 发明人 邵枫;王珊珊;李福
分类号 G06T7/00(2006.01)I 主分类号 G06T7/00(2006.01)I
代理机构 宁波奥圣专利代理事务所(普通合伙) 33226 代理人 周珏
主权项 一种针对模糊失真立体图像的无参考质量评价方法,其特征在于包括训练阶段和测试阶段两个过程,具体步骤如下:①选取N幅原始的无失真立体图像;然后将选取的N幅原始的无失真立体图像和每幅原始的无失真立体图像对应的模糊失真立体图像构成训练图像集,记为{S<sub>i,org</sub>,S<sub>i,dis</sub>|1≤i≤N},S<sub>i,org</sub>表示训练图像集{S<sub>i,org</sub>,S<sub>i,dis</sub>|1≤i≤N}中的第i幅原始的无失真立体图像,S<sub>i,dis</sub>表示训练图像集{S<sub>i,org</sub>,S<sub>i,dis</sub>|1≤i≤N}中的第i幅原始的无失真立体图像对应的模糊失真立体图像;再将S<sub>i,org</sub>的左视点图像记为L<sub>i,org</sub>,将S<sub>i,org</sub>的右视点图像记为R<sub>i,org</sub>,将S<sub>i,dis</sub>的左视点图像记为L<sub>i,dis</sub>,将S<sub>i,dis</sub>的右视点图像记为R<sub>i,dis</sub>;②对训练图像集{S<sub>i,org</sub>,S<sub>i,dis</sub>|1≤i≤N}中的每幅模糊失真立体图像的左视点图像和右视点图像分别实施二维经验模式分解,得到训练图像集{S<sub>i,org</sub>,S<sub>i,dis</sub>|1≤i≤N}中的每幅模糊失真立体图像的左视点图像和右视点图像各自的内蕴模式函数图像,将L<sub>i,dis</sub>的内蕴模式函数图像记为<img file="FDA0000479523550000011.GIF" wi="346" he="95" />将R<sub>i,dis</sub>的内蕴模式函数图像记为<img file="FDA0000479523550000012.GIF" wi="354" he="95" />其中,1≤x≤W,1≤y≤H,在此W表示<img file="FDA0000479523550000013.GIF" wi="318" he="95" />和<img file="FDA0000479523550000014.GIF" wi="314" he="95" />的宽度,在此H表示<img file="FDA0000479523550000015.GIF" wi="310" he="95" />和<img file="FDA0000479523550000016.GIF" wi="316" he="95" />的高度,<img file="FDA0000479523550000017.GIF" wi="282" he="78" />表示<img file="FDA0000479523550000018.GIF" wi="318" he="95" />中坐标位置为(x,y)的像素点的像素值,<img file="FDA0000479523550000019.GIF" wi="278" he="78" />表示<img file="FDA00004795235500000110.GIF" wi="324" he="95" />中坐标位置为(x,y)的像素点的像素值;然后对训练图像集{S<sub>i,org</sub>,S<sub>i,dis</sub>|1≤i≤N}中的每幅模糊失真立体图像的左视点图像的内蕴模式函数图像和右视点图像的内蕴模式函数图像进行线性加权,得到训练图像集{S<sub>i,org</sub>,S<sub>i,dis</sub>|1≤i≤N}中的每幅模糊失真立体图像的内蕴模式函数图像,将S<sub>i,dis</sub>的内蕴模式函数图像记为<img file="FDA00004795235500000111.GIF" wi="320" he="95" />将<img file="FDA00004795235500000112.GIF" wi="293" he="95" />中坐标位置为(x,y)的像素点的像素值记为<img file="FDA00004795235500000113.GIF" wi="285" he="74" /><maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msubsup><mi>IMF</mi><mi>i</mi><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>=</mo><msub><mi>w</mi><mi>L</mi></msub><mo>&times;</mo><msubsup><mi>IMF</mi><mi>i</mi><mrow><mi>L</mi><mo>,</mo><mi>dis</mi></mrow></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>+</mo><msub><mi>w</mi><mi>R</mi></msub><mo>&times;</mo><msubsup><mi>IMF</mi><mi>i</mi><mrow><mi>R</mi><mo>,</mo><mi>dis</mi></mrow></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>,</mo></mrow>]]></math><img file="FDA00004795235500000114.GIF" wi="1128" he="79" /></maths>其中,w<sub>L</sub>为<img file="FDA00004795235500000115.GIF" wi="288" he="80" />的权值比重,w<sub>R</sub>为<img file="FDA00004795235500000116.GIF" wi="276" he="78" />的权值比重,w<sub>L</sub>+w<sub>R</sub>=1;③对训练图像集{S<sub>i,org</sub>,S<sub>i,dis</sub>|1≤i≤N}中的每幅模糊失真立体图像的内蕴模式函数图像进行非重叠的分块处理;然后采用K均值聚类方法对由每幅内蕴模式函数图像中的所有子块构成的集合进行聚类操作,得到每幅内蕴模式函数图像的K个聚类,其中,K表示每幅内蕴模式函数图像包含的聚类的总个数;接着根据每幅内蕴模式函数图像的K个聚类,获取每幅内蕴模式函数图像的视觉字典表;再根据所有内蕴模式函数图像的视觉字典表,得到训练图像集{S<sub>i,org</sub>,S<sub>i,dis</sub>|1≤i≤N}的视觉字典表,记为G,G={G<sub>i</sub>|1≤i≤N},其中,G<sub>i</sub>表示<img file="FDA0000479523550000024.GIF" wi="283" he="71" />的视觉字典表,G<sub>i</sub>={g<sub>i,k</sub>|1≤k≤K},g<sub>i,k</sub>表示<img file="FDA0000479523550000025.GIF" wi="287" he="72" />的第k个聚类的视觉字典,g<sub>i,k</sub>亦表示<img file="FDA0000479523550000026.GIF" wi="287" he="72" />的第k个聚类的质心;④通过计算训练图像集{S<sub>i,org</sub>,S<sub>i,dis</sub>|1≤i≤N}中的每幅原始的无失真立体图像的左视点图像和右视点图像中的每个像素点在选定的中心频率和不同方向因子下的频率响应,及每幅模糊失真立体图像的左视点图像和右视点图像中的每个像素点在选定的中心频率和不同方向因子下的频率响应,获取每幅模糊失真立体图像中的每个像素点的客观评价度量值;然后根据每幅模糊失真立体图像中的每个像素点的客观评价度量值,获取每幅模糊失真立体图像的视觉质量表;再根据所有模糊失真立体图像的视觉质量表,得到训练图像集{S<sub>i,org</sub>,S<sub>i,dis</sub>|1≤i≤N}的视觉质量表,记为Q,Q={Q<sub>i</sub>|1≤i≤N},其中,Q<sub>i</sub>表示S<sub>i,dis</sub>的视觉质量表,Q<sub>i</sub>={q<sub>i,k</sub>|1≤k≤K},q<sub>i,k</sub>表示<img file="FDA0000479523550000027.GIF" wi="287" he="81" />的第k个聚类的视觉质量;⑤对于任意一副测试立体图像S<sub>test</sub>,根据训练图像集{S<sub>i,org</sub>,S<sub>i,dis</sub>|1≤i≤N}的视觉字典表G和视觉质量表Q,计算得到S<sub>test</sub>的图像质量客观评价预测值。
地址 315211 浙江省宁波市江北区风华路818号
您可能感兴趣的专利