发明名称 基于视觉阈值与通道融合的立体图像客观质量评价方法
摘要 本发明公开了一种基于视觉阈值与通道融合的立体图像客观质量评价方法,其通过对无失真的立体图像和失真的立体图像的左视点图像和右视点图像分通道进行视觉阈值分析和奇异值分解;然后通过对无失真的立体图像和失真的立体图像的左右视点图像的绝对视差图像的差值图像分通道进行视觉阈值分析和奇异值分解,采用线性组合方式得到立体感知评价度量;最后将客观评价尺度度量和立体感知评价度量两者进行线性加权结合,得到立体图像的总体质量评价客观值,不仅有效利用了恰可察觉失真的视觉阈值、视觉掩盖效应以及立体感知等人眼视觉特性,而且在评价左右视点图像质量的基础上,同时评价了立体感知,因此提高了客观质量评价结果与主观感知之间的相关性。
申请公布号 CN103108209B 申请公布日期 2015.03.11
申请号 CN201210585736.0 申请日期 2012.12.28
申请人 宁波大学 发明人 郁梅;孔真真;蒋刚毅;彭宗举;邵枫
分类号 H04N17/00(2006.01)I 主分类号 H04N17/00(2006.01)I
代理机构 宁波奥圣专利代理事务所(普通合伙) 33226 代理人 周珏
主权项 一种基于视觉阈值与通道融合的立体图像客观质量评价方法,其特征在于具体包括以下步骤:①令S<sub>org</sub>为原始的无失真的立体图像,令S<sub>dis</sub>为失真的立体图像,将原始的无失真的立体图像S<sub>org</sub>的左视点图像记为L<sub>org</sub>,将原始的无失真的立体图像S<sub>org</sub>的右视点图像记为R<sub>org</sub>,将失真的立体图像S<sub>dis</sub>的左视点图像记为L<sub>dis</sub>,将失真的立体图像S<sub>dis</sub>的右视点图像记为R<sub>dis</sub>;②计算L<sub>org</sub>与L<sub>dis</sub>的差值图,记为D<sub>l</sub>,D<sub>l</sub>=|L<sub>org</sub>‑L<sub>dis</sub>|,并计算R<sub>org</sub>与R<sub>dis</sub>的差值图,记为D<sub>r</sub>,D<sub>r</sub>=|R<sub>org</sub>‑R<sub>dis</sub>|,然后计算L<sub>org</sub>与R<sub>org</sub>的差值图,记为D<sub>org</sub>,D<sub>org</sub>=|L<sub>org</sub>‑R<sub>org</sub>|,并计算L<sub>dis</sub>与R<sub>dis</sub>的差值图,记为D<sub>dis</sub>,D<sub>dis</sub>=|L<sub>dis</sub>‑R<sub>dis</sub>|,再计算D<sub>org</sub>与D<sub>dis</sub>的差值图,记为DD,DD=|D<sub>org</sub>‑D<sub>dis</sub>|,其中,“||”为取绝对值符号;③获取L<sub>org</sub>的视觉阈值图,记为<img file="FDA0000585536630000016.GIF" wi="168" he="86" />将L<sub>org</sub>的视觉阈值图<img file="FDA0000585536630000017.GIF" wi="141" he="86" />中坐标位置为(i,j)的像素点的视觉阈值记为<img file="FDA0000585536630000018.GIF" wi="353" he="91" /><maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msubsup><mi>JND</mi><mi>org</mi><mi>l</mi></msubsup><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>=</mo><msup><mi>T</mi><mi>l</mi></msup><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>+</mo><msup><mi>T</mi><mi>t</mi></msup><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>-</mo><mi>C</mi><mo>&times;</mo><mi>min</mi><mo>{</mo><msup><mi>T</mi><mi>l</mi></msup><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>,</mo><msup><mi>T</mi><mi>t</mi></msup><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>}</mo><mo>,</mo></mrow>]]></math><img file="FDA0000585536630000019.GIF" wi="1195" he="104" /></maths>其中,1≤i≤W,1≤j≤H,W表示立体图像的宽度,H表示立体图像的高度,T<sup>l</sup>(i,j)表示L<sub>org</sub>中坐标位置为(i,j)的像素点对应的亮度阈值,<img file="FDA0000585536630000011.GIF" wi="951" he="246" /><img file="FDA0000585536630000012.GIF" wi="134" he="82" />表示L<sub>org</sub>中坐标位置为(i,j)的像素点的亮度值的均值,<img file="FDA0000585536630000013.GIF" wi="1703" he="189" />I(i,j)表示L<sub>org</sub>中坐标位置为(i,j)的像素点的亮度值,I(i‑3+m,j‑3+n)表示L<sub>org</sub>中坐标位置为(i‑3+m,j‑3+n)的像素点的亮度值,B(m,n)表示5×5的低通滤波器中坐标位置为(m,n)处的值,T<sup>t</sup>(i,j)表示L<sub>org</sub>中坐标位置为(i,j)的像素点对应的纹理阈值,T<sup>t</sup>(i,j)=α(i,j)×G(i,j)+β(i,j),<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mi>&alpha;</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>=</mo><mn>0.0001</mn><mo>&times;</mo><mover><mrow><mi>I</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow></mrow><mo>&OverBar;</mo></mover><mo>+</mo><mn>0.115</mn><mo>,</mo></mrow>]]></math><img file="FDA0000585536630000014.GIF" wi="826" he="85" /></maths><img file="FDA0000585536630000015.GIF" wi="572" he="83" />G(i,j)表示L<sub>org</sub>中坐标位置为(i,j)的像素点分别通过水平方向、垂直方向、45°方向和135°方向的高通滤波器滤波后得到的四个值中的最大值,C为加权系数,min()为取最小值函数;获取R<sub>org</sub>的视觉阈值图,记为<img file="FDA0000585536630000021.GIF" wi="162" he="77" />将R<sub>org</sub>的视觉阈值图<img file="FDA0000585536630000022.GIF" wi="146" he="86" />中坐标位置为(i,j)的像素点的视觉阈值记为<img file="FDA0000585536630000023.GIF" wi="372" he="91" /><maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><msubsup><mi>JND</mi><mi>org</mi><mi>r</mi></msubsup><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>=</mo><msup><mi>T</mi><mi>r</mi></msup><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>+</mo><msup><mi>T</mi><mrow><mi>t</mi><mo>&prime;</mo></mrow></msup><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>-</mo><mi>C</mi><mo>&times;</mo><mi>min</mi><mo>{</mo><msup><mi>T</mi><mi>r</mi></msup><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>,</mo><msup><mi>T</mi><mrow><mi>t</mi><mo>&prime;</mo></mrow></msup><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>}</mo><mo>,</mo></mrow>]]></math><img file="FDA0000585536630000024.GIF" wi="1228" he="105" /></maths>其中,1≤i≤W,1≤j≤H,W表示立体图像的宽度,H表示立体图像的高度,T<sup>r</sup>(i,j)表示R<sub>org</sub>中坐标位置为(i,j)的像素点对应的亮度阈值,<img file="FDA0000585536630000025.GIF" wi="980" he="255" /><img file="FDA0000585536630000026.GIF" wi="148" he="85" />表示R<sub>org</sub>中坐标位置为(i,j)的像素点的亮度值的均值,<img file="FDA0000585536630000027.GIF" wi="1738" he="196" />I'(i,j)表示R<sub>org</sub>中坐标位置为(i,j)的像素点的亮度值,I'(i‑3+m,j‑3+n)表示R<sub>org</sub>中坐标位置为(i‑3+m,j‑3+n)的像素点的亮度值,B(m,n)表示5×5的低通滤波器中坐标位置为(m,n)处的值,T<sup>t</sup>'(i,j)表示R<sub>org</sub>中坐标位置为(i,j)的像素点对应的纹理阈值,T<sup>t</sup>'(i,j)=α'(i,j)×G'(i,j)+β'(i,j),<maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><msup><mi>&alpha;</mi><mo>&prime;</mo></msup><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>=</mo><mn>0.0001</mn><mo>&times;</mo><mover><mrow><msup><mi>I</mi><mo>&prime;</mo></msup><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow></mrow><mo>&OverBar;</mo></mover><mo>+</mo><mn>0.115</mn><mo>,</mo></mrow>]]></math><img file="FDA0000585536630000028.GIF" wi="825" he="82" /></maths><img file="FDA0000585536630000029.GIF" wi="599" he="85" />G'(i,j)表示R<sub>org</sub>中坐标位置为(i,j)的像素点分别通过水平方向、垂直方向、45°方向和135°方向的高通滤波器滤波后得到的四个值中的最大值,C为加权系数,min()为取最小值函数;④将L<sub>org</sub>与L<sub>dis</sub>的差值图D<sub>l</sub>分成RGB三个通道的图像,并将L<sub>org</sub>与L<sub>dis</sub>的差值图D<sub>l</sub>的第u个通道的图像记为D<sub>l_u</sub>;将R<sub>org</sub>与R<sub>dis</sub>的差值图D<sub>r</sub>分成RGB三个通道的图像,并将R<sub>org</sub>与R<sub>dis</sub>的差值图D<sub>r</sub>的第u个通道的图像记为D<sub>r_u</sub>;将L<sub>org</sub>的视觉阈值图<img file="FDA00005855366300000210.GIF" wi="150" he="88" />分成RGB三个通道的图像,并将L<sub>org</sub>的视觉阈值图<img file="FDA00005855366300000211.GIF" wi="152" he="85" />的第u个通道的图像记为<img file="FDA00005855366300000212.GIF" wi="214" he="85" />将R<sub>org</sub>的视觉阈值图<img file="FDA00005855366300000213.GIF" wi="148" he="77" />分成RGB三个通道的图像,并将R<sub>org</sub>的视觉阈值图<img file="FDA00005855366300000214.GIF" wi="148" he="83" />的第u个通道的图像记为<img file="FDA00005855366300000215.GIF" wi="214" he="81" />其中,u=1,2,3,u=1表示R通道,u=2表示G通道,u=3表示B通道;⑤将D<sub>l</sub>的RGB三个通道的图像、D<sub>r</sub>的RGB三个通道的图像、<img file="FDA00005855366300000216.GIF" wi="153" he="84" />的RGB三个通道的图像、<img file="FDA00005855366300000217.GIF" wi="150" he="81" />的RGB三个通道的图像分别分割成<img file="FDA00005855366300000218.GIF" wi="200" he="145" />个互不重叠的尺寸大小为8×8的图像块,然后对D<sub>l</sub>的RGB三个通道的图像、D<sub>r</sub>的RGB三个通道的图像、<img file="FDA0000585536630000031.GIF" wi="147" he="89" />的RGB三个通道的图像、<img file="FDA0000585536630000032.GIF" wi="149" he="80" />的RGB三个通道的图像中的每个图像块进行奇异值分解,得到每个图像块各自对应的奇异值矩阵,将D<sub>l</sub>的第u个通道的图像D<sub>l_u</sub>中的第k个图像块的奇异值矩阵记为S<sub>l_u_k</sub>,将D<sub>r</sub>的第u个通道的图像D<sub>r_u</sub>中的第k个图像块的奇异值矩阵记为S<sub>r_u_k</sub>,将<img file="FDA0000585536630000033.GIF" wi="148" he="87" />的第u个通道的图像<img file="FDA0000585536630000034.GIF" wi="184" he="84" />中的第k个图像块的奇异值矩阵记为<img file="FDA0000585536630000035.GIF" wi="186" he="90" />将<img file="FDA0000585536630000036.GIF" wi="148" he="85" />的第u个通道的图像<img file="FDA0000585536630000037.GIF" wi="185" he="84" />中的第k个图像块的奇异值矩阵记为<img file="FDA0000585536630000038.GIF" wi="190" he="83" />其中,<img file="FDA0000585536630000039.GIF" wi="138" he="83" />为向下取整符号,<img file="FDA00005855366300000310.GIF" wi="366" he="142" />⑥计算D<sub>l</sub>的每个通道的图像中的每个图像块与<img file="FDA00005855366300000311.GIF" wi="148" he="85" />的对应通道的图像中的对应图像块之间的奇异值距离,将D<sub>l</sub>的第u个通道的图像D<sub>l_u</sub>中的第k个图像块与<img file="FDA00005855366300000312.GIF" wi="144" he="85" />的第u个通道的图像<img file="FDA00005855366300000313.GIF" wi="186" he="85" />中的第k个图像块之间的奇异值距离记为<img file="FDA00005855366300000314.GIF" wi="126" he="82" /><maths num="0005" id="cmaths0005"><math><![CDATA[<mrow><msubsup><mi>d</mi><mrow><mi>u</mi><mo>,</mo><mi>k</mi></mrow><mi>l</mi></msubsup><mo>=</mo><msqrt><munderover><mi>&Sigma;</mi><mrow><mi>x</mi><mo>=</mo><mn>1</mn></mrow><mn>8</mn></munderover><munderover><mi>&Sigma;</mi><mrow><mi>y</mi><mo>=</mo><mn>1</mn></mrow><mn>8</mn></munderover><msup><mrow><mo>(</mo><mi>w</mi><mo>&times;</mo><mrow><mo>(</mo><msub><mi>S</mi><mrow><mi>l</mi><mo>_</mo><mi>u</mi><mo>_</mo><mi>k</mi></mrow></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>-</mo><msubsup><mi>S</mi><mrow><mi>org</mi><mo>_</mo><mi>u</mi><mo>_</mo><mi>k</mi></mrow><mi>l</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>)</mo></mrow><mn>2</mn></msup></msqrt><mo>,</mo></mrow>]]></math><img file="FDA00005855366300000315.GIF" wi="1045" he="165" /></maths>然后计算L<sub>dis</sub>的每个通道的全局失真程度值,将L<sub>dis</sub>的第u个通道的全局失真程度值记为Q<sub>l,u</sub>,<img file="FDA00005855366300000316.GIF" wi="660" he="164" />其中,w表示失真判断值,<img file="FDA00005855366300000317.GIF" wi="861" he="171" />w=1时表示D<sub>l</sub>的第u个通道的图像D<sub>l_u</sub>中的第k个图像块中坐标位置为(x,y)的像素点失真,w=0时表示D<sub>l</sub>的第u个通道的图像D<sub>l_u</sub>中的第k个图像块中坐标位置为(x,y)的像素点不失真,S<sub>l_u_k</sub>(x,y)表示S<sub>l_u_k</sub>中坐标位置为(x,y)处的奇异值,<img file="FDA00005855366300000318.GIF" wi="275" he="91" />表示<img file="FDA00005855366300000319.GIF" wi="157" he="87" />中坐标位置为(x,y)处的奇异值,<img file="FDA00005855366300000320.GIF" wi="319" he="143" />“||”为取绝对值符号,D<sub>median_l,u</sub>表示D<sub>l</sub>的第u个通道的图像中的所有图像块与<img file="FDA00005855366300000321.GIF" wi="150" he="86" />的第u个通道的图像中的所有图像块对应图像块之间的奇异值距离的中值;⑦计算D<sub>r</sub>的每个通道的图像中的每个图像块与<img file="FDA00005855366300000322.GIF" wi="153" he="81" />的对应通道的图像中的对应图像块之间的奇异值距离,将D<sub>r</sub>的第u个通道的图像D<sub>r_u</sub>中的第k个图像块与<img file="FDA00005855366300000323.GIF" wi="151" he="84" />的第u个通道的图像<img file="FDA00005855366300000324.GIF" wi="185" he="77" />中的第k个图像块之间的奇异值距离记为<img file="FDA00005855366300000325.GIF" wi="126" he="77" /><maths num="0006" id="cmaths0006"><math><![CDATA[<mrow><msubsup><mi>d</mi><mrow><mi>u</mi><mo>,</mo><mi>k</mi></mrow><mi>r</mi></msubsup><mo>=</mo><msqrt><munderover><mi>&Sigma;</mi><mrow><mi>x</mi><mo>=</mo><mn>1</mn></mrow><mn>8</mn></munderover><munderover><mi>&Sigma;</mi><mrow><mi>y</mi><mo>=</mo><mn>1</mn></mrow><mn>8</mn></munderover><msup><mrow><mo>(</mo><mi>w</mi><mo>&times;</mo><mrow><mo>(</mo><msub><mi>S</mi><mrow><mi>r</mi><mo>_</mo><mi>u</mi><mo>_</mo><mi>k</mi></mrow></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>-</mo><msubsup><mi>S</mi><mrow><mi>org</mi><mo>_</mo><mi>u</mi><mo>_</mo><mi>k</mi></mrow><mi>r</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>)</mo></mrow><mn>2</mn></msup></msqrt><mo>,</mo></mrow>]]></math><img file="FDA00005855366300000326.GIF" wi="1053" he="165" /></maths>然后计算R<sub>dis</sub>的每个通道的全局失真程度值,将R<sub>dis</sub>的第u个通道的全局失真程度值记为Q<sub>r,u</sub>,<img file="FDA0000585536630000041.GIF" wi="671" he="163" />其中,w表示失真判断值,<img file="FDA0000585536630000042.GIF" wi="863" he="178" />w=1时表示D<sub>r</sub>的第u个通道的图像D<sub>r_u</sub>中的第k个图像块中坐标位置为(x,y)的像素点失真,w=0时表示D<sub>r</sub>的第u个通道的图像D<sub>r_u</sub>中的第k个图像块中坐标位置为(x,y)的像素点不失真,S<sub>r_u_k</sub>(x,y)表示S<sub>r_u_k</sub>中坐标位置为(x,y)处的奇异值,<img file="FDA0000585536630000043.GIF" wi="279" he="95" />表示<img file="FDA0000585536630000044.GIF" wi="161" he="93" />中坐标位置为(x,y)处的奇异值,<img file="FDA0000585536630000045.GIF" wi="321" he="145" />“||”为取绝对值符号,D<sub>median_r,u</sub>表示D<sub>r</sub>的第u个通道的图像中的所有图像块与<img file="FDA0000585536630000046.GIF" wi="144" he="78" />的第u个通道的图像中的所有图像块对应图像块之间的奇异值距离的中值;⑧根据L<sub>dis</sub>的每个通道的全局失真程度值和R<sub>dis</sub>的每个通道的全局失真程度值,计算S<sub>dis</sub>相对于S<sub>org</sub>的客观评价尺度度量,记为Q<sub>s</sub>,<img file="FDA0000585536630000047.GIF" wi="687" he="145" />其中,b<sub>u</sub>表示第u个通道的权重值,w<sub>l</sub>表示在一种失真类型下左视点图像质量在立体图像质量中所占的权重,w<sub>r</sub>表示在同一种失真类型下右视点图像质量在立体图像质量中所占的权重,w<sub>l</sub>+w<sub>r</sub>=1;⑨获取R<sub>org</sub>的背景亮度图像和边缘强度图像,分别记为bg<sub>org</sub>和eh<sub>org</sub>;然后根据R<sub>org</sub>的背景亮度图像bg<sub>org</sub>和边缘强度图像eh<sub>org</sub>,以R<sub>org</sub>为参考图像,获取L<sub>org</sub>的全局双目恰可觉察失真阈值图,记为<img file="FDA0000585536630000048.GIF" wi="203" he="89" />将L<sub>org</sub>的全局双目恰可觉察失真阈值图<img file="FDA0000585536630000049.GIF" wi="178" he="84" />中坐标位置为(i,j)的像素点的全局双目恰可觉察失真阈值记为<img file="FDA00005855366300000410.GIF" wi="324" he="88" /><maths num="0007" id="cmaths0007"><math><![CDATA[<mrow><msubsup><mi>BJND</mi><mi>org</mi><mi>l</mi></msubsup><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>=</mo><msub><mi>T</mi><mrow><mi>C</mi><mo>,</mo><mi>lim</mi></mrow></msub><mrow><mo>(</mo><mi>i</mi><mo>,</mo><msup><mi>j</mi><mo>&prime;</mo></msup><mo>)</mo></mrow><mo>&times;</mo><msup><mrow><mo>(</mo><mn>1</mn><mo>-</mo><msup><mrow><mo>(</mo><mfrac><mrow><msub><mi>n</mi><mi>r</mi></msub><mrow><mo>(</mo><mi>i</mi><mo>,</mo><msup><mi>j</mi><mo>&prime;</mo></msup><mo>)</mo></mrow></mrow><mrow><msub><mi>T</mi><mrow><mi>C</mi><mo>,</mo><mi>lim</mi></mrow></msub><mrow><mo>(</mo><mi>i</mi><mo>,</mo><msup><mi>j</mi><mo>&prime;</mo></msup><mo>)</mo></mrow></mrow></mfrac><mo>)</mo></mrow><mi>&lambda;</mi></msup><mo>)</mo></mrow><mrow><mn>1</mn><mo>/</mo><mi>&lambda;</mi></mrow></msup><mo>,</mo></mrow>]]></math><img file="FDA00005855366300000411.GIF" wi="1010" he="162" /></maths>其中,j'=j+d(i,j),d(i,j)表示L<sub>org</sub>中坐标位置为(i,j)的像素点相对于R<sub>org</sub>中坐标位置为(i,j)的像素点的水平视差值,L<sub>org</sub>中坐标位置为(i,j')的像素点为通过坐标位置为(i,j)的像素点在水平方向上向右移动d(i,j)个像素点获得,T<sub>C,lim</sub>(i,j')表示L<sub>org</sub>中坐标位置为(i,j')的像素点的对比度掩蔽效应的最大失真阈值,T<sub>C,lim</sub>(i,j')=T<sub>C</sub>(bg<sub>org</sub>(i,j'))+K(bg<sub>org</sub>(i,j'))×eh<sub>org</sub>(i,j'),T<sub>C</sub>(bg<sub>org</sub>(i,j'))表示右视点图像在给定bg<sub>org</sub>(i,j')的情况下引发感知差异的最小噪声幅值,K(bg<sub>org</sub>(i,j'))表示依据主观实验结果建立的增大因子拟合函数,K(bg<sub>org</sub>(i,j'))=‑10<sup>(‑6)</sup>×(0.7×bg<sub>org</sub>(i,j')<sup>2</sup>+32×bg<sub>org</sub>(i,j'))+0.07,bg<sub>org</sub>(i,j')表示bg<sub>org</sub>中坐标位置为(i,j')的像素点的像素值,eh<sub>org</sub>(i,j')表示eh<sub>org</sub>中坐标位置为(i,j')的像素点的像素值,n<sub>r</sub>(i,j')表示R<sub>org</sub>中坐标位置为(i,j')的像素点上的噪声幅值,λ为控制主观亮度掩蔽对实验结果影响的参数;⑩将DD分成RGB三个通道的图像,并将DD的第u个通道的图像记为DD<sub>u</sub>;将<img file="FDA0000585536630000051.GIF" wi="178" he="89" />分成RGB三个通道的图像,并将<img file="FDA0000585536630000052.GIF" wi="173" he="90" />的第u个通道的图像记为<img file="FDA0000585536630000053.GIF" wi="237" he="88" />其中,u=1,2,3,u=1表示R通道,u=2表示G通道,u=3表示B通道;<img file="FDA0000585536630000054.GIF" wi="62" he="72" />将DD的RGB三个通道的图像、<img file="FDA0000585536630000055.GIF" wi="182" he="84" />的RGB三个通道的图像分别分割成<img file="FDA0000585536630000056.GIF" wi="204" he="146" />个互不重叠的尺寸大小为8×8的图像块,然后对DD的RGB三个通道的图像、<img file="FDA0000585536630000057.GIF" wi="179" he="84" />的RGB三个通道的图像中的每个图像块进行奇异值分解,得到每个图像块各自对应的奇异值矩阵,将DD的第u个通道的图像DD<sub>u</sub>中的第k个图像块的奇异值矩阵记为S<sub>DD_u_k</sub>,将<img file="FDA0000585536630000058.GIF" wi="179" he="84" />的第u个通道的图像<img file="FDA0000585536630000059.GIF" wi="219" he="84" />中的第k个图像块的奇异值矩阵记为<img file="FDA00005855366300000510.GIF" wi="197" he="86" />其中,<img file="FDA00005855366300000511.GIF" wi="140" he="83" />为向下取整符号,<img file="FDA00005855366300000512.GIF" wi="366" he="145" /><img file="FDA00005855366300000513.GIF" wi="62" he="72" />计算DD的每个通道的图像中的每个图像块与<img file="FDA00005855366300000514.GIF" wi="172" he="86" />的对应通道的图像中的对应图像块之间的奇异值距离,将DD的第u个通道的图像DD<sub>u</sub>中的第k个图像块与<img file="FDA00005855366300000515.GIF" wi="180" he="84" />的第u个通道的图像<img file="FDA00005855366300000516.GIF" wi="214" he="84" />中的第k个图像块之间的奇异值距离记为<img file="FDA00005855366300000517.GIF" wi="125" he="85" /><maths num="0008" id="cmaths0008"><math><![CDATA[<mrow><msubsup><mi>d</mi><mrow><mi>u</mi><mo>,</mo><mi>k</mi></mrow><mi>DD</mi></msubsup><mo>=</mo><msqrt><munderover><mi>&Sigma;</mi><mrow><mi>x</mi><mo>=</mo><mn>1</mn></mrow><mn>8</mn></munderover><munderover><mi>&Sigma;</mi><mrow><mi>y</mi><mo>=</mo><mn>1</mn></mrow><mn>8</mn></munderover><msup><mrow><mo>(</mo><msup><mi>w</mi><mo>&prime;</mo></msup><mo>&times;</mo><mrow><mo>(</mo><msub><mi>S</mi><mrow><mi>DD</mi><mo>_</mo><mi>u</mi><mo>_</mo><mi>k</mi></mrow></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>-</mo><msubsup><mi>S</mi><mrow><mi>org</mi><mo>_</mo><mi>u</mi><mo>_</mo><mi>k</mi></mrow><mi>l</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>)</mo></mrow><mn>2</mn></msup></msqrt><mo>,</mo></mrow>]]></math><img file="FDA00005855366300000518.GIF" wi="1111" he="170" /></maths>然后计算S<sub>dis</sub>相对于S<sub>org</sub>的立体感知评价度量,记为Q<sub>d</sub>,<maths num="0009" id="cmaths0009"><math><![CDATA[<mrow><msub><mi>Q</mi><mi>d</mi></msub><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>u</mi><mo>=</mo><mn>1</mn></mrow><mn>3</mn></munderover><msub><mi>b</mi><mi>u</mi></msub><mo>&times;</mo><mrow><mo>(</mo><mfrac><mn>1</mn><mi>K</mi></mfrac><munderover><mi>&Sigma;</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>K</mi></munderover><mo>|</mo><msubsup><mi>d</mi><mrow><mi>u</mi><mo>,</mo><mi>k</mi></mrow><mi>DD</mi></msubsup><mo>-</mo><msub><mi>D</mi><mrow><mi>median</mi><mo>_</mo><mi>DD</mi><mo>,</mo><mi>u</mi></mrow></msub><mo>|</mo><mo>)</mo></mrow><mo>,</mo></mrow>]]></math><img file="FDA00005855366300000519.GIF" wi="900" he="177" /></maths>其中,w'表示失真判断值,<img file="FDA0000585536630000061.GIF" wi="903" he="170" />w'=1时表示DD的第u个通道的图像DD<sub>u</sub>中的第k个图像块中坐标位置为(x,y)的像素点失真,w'=0时表示DD的第u个通道的图像DD<sub>u</sub>中的第k个图像块中坐标位置为(x,y)的像素点不失真,S<sub>DD_u_k</sub>(x,y)表示S<sub>DD_u_k</sub>中坐标位置为(x,y)处的奇异值,<img file="FDA0000585536630000062.GIF" wi="275" he="90" />表示<img file="FDA0000585536630000063.GIF" wi="159" he="90" />中坐标位置为(x,y)处的奇异值,<img file="FDA0000585536630000064.GIF" wi="321" he="144" />“||”为取绝对值符号,b<sub>u</sub>表示第u个通道的权重值,D<sub>median_DD,u</sub>表示DD的第u个通道的图像DD<sub>u</sub>中的所有图像块与<img file="FDA0000585536630000065.GIF" wi="181" he="84" />的第u个通道的图像<img file="FDA0000585536630000066.GIF" wi="214" he="84" />中的所有图像块对应图像块之间的奇异值距离的中值;<img file="FDA0000585536630000067.GIF" wi="64" he="76" />根据S<sub>dis</sub>相对于S<sub>org</sub>的客观评价尺度度量Q<sub>s</sub>和S<sub>dis</sub>相对于S<sub>org</sub>的立体感知评价度量Q<sub>d</sub>,计算S<sub>dis</sub>的总体质量评价客观值,记为Q,Q=W<sub>type</sub>×Q<sub>s</sub>+(1‑W<sub>type</sub>)×Q<sub>d</sub>,其中,W<sub>type</sub>表示在同一种失真类型下Q<sub>s</sub>的权重值。
地址 315211 浙江省宁波市江北区风华路818号