主权项 |
1.一种基于梯度结构张量的立体图像质量客观评价方法,其特征在于包括以下步骤:①令S<sub>org</sub>为原始的无失真的立体图像,令S<sub>dis</sub>为待评价的失真的立体图像,将S<sub>org</sub>的左视点图像记为{L<sub>org</sub>(x,y)},将S<sub>org</sub>的右视点图像记为{R<sub>org</sub>(x,y)},将S<sub>dis</sub>的左视点图像记为{L<sub>dis</sub>(x,y)},将S<sub>dis</sub>的右视点图像记为{R<sub>dis</sub>(x,y)},其中,(x,y)表示左视点图像和右视点图像中的像素点的坐标位置,1≤x≤W,1≤y≤H,W表示左视点图像和右视点图像的宽度,H表示左视点图像和右视点图像的高度,L<sub>org</sub>(x,y)表示{L<sub>org</sub>(x,y)}中坐标位置为(x,y)的像素点的像素值,R<sub>org</sub>(x,y)表示{R<sub>org</sub>(x,y)}中坐标位置为(x,y)的像素点的像素值,L<sub>dis</sub>(x,y)表示{L<sub>dis</sub>(x,y)}中坐标位置为(x,y)的像素点的像素值,R<sub>dis</sub>(x,y)表示{R<sub>dis</sub>(x,y)}中坐标位置为(x,y)的像素点的像素值;②计算{L<sub>org</sub>(x,y)}中的每个像素点的水平方向梯度、垂直方向梯度和视点方向梯度,将{L<sub>org</sub>(x,y)}中坐标位置为(x,y)的像素点的水平方向梯度记为<img file="FDA00001726599800011.GIF" wi="225" he="50" />将{L<sub>org</sub>(x,y)}中坐标位置为(x,y)的像素点的垂直方向梯度记为<img file="FDA00001726599800012.GIF" wi="226" he="50" />将{L<sub>org</sub>(x,y)}中坐标位置为(x,y)的像素点的视点方向梯度记为<img file="FDA00001726599800013.GIF" wi="224" he="50" />计算{L<sub>dis</sub>(x,y)}中的每个像素点的水平方向梯度、垂直方向梯度和视点方向梯度,将{L<sub>dis</sub>(x,y)}中坐标位置为(x,y)的像素点的水平方向梯度记为<img file="FDA00001726599800014.GIF" wi="221" he="56" />将{L<sub>dis</sub>(x,y)}中坐标位置为(x,y)的像素点的垂直方向梯度记为<img file="FDA00001726599800015.GIF" wi="221" he="55" />将{L<sub>dis</sub>(x,y)}中坐标位置为(x,y)的像素点的视点方向梯度记为<img file="FDA00001726599800016.GIF" wi="216" he="55" />③利用区域检测算法分别获取{L<sub>dis</sub>(x,y)}中的每个像素点的区域类型,记为p,其中,p∈{1,2},p=1表示敏感区域,p=2表示非敏感区域;④根据{L<sub>org</sub>(x,y)}中的每个像素点的水平方向梯度、垂直方向梯度和视点方向梯度,计算{L<sub>org</sub>(x,y)}中的每个像素点的梯度结构张量,将{L<sub>org</sub>(x,y)}中坐标位置为(x,y)的像素点的梯度结构张量记为Z<sub>org</sub>(x,y),<maths num="0001"><![CDATA[<math><mrow><msub><mi>Z</mi><mi>org</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>=</mo><mfenced open='[' close=']'><mtable><mtr><mtd><msubsup><mi>gx</mi><mi>L</mi><mi>org</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>×</mo><msubsup><mi>gx</mi><mi>L</mi><mi>org</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></mtd><mtd><msubsup><mi>gy</mi><mi>L</mi><mi>org</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>×</mo><msubsup><mi>gx</mi><mi>L</mi><mi>org</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></mtd><mtd><msubsup><mi>gz</mi><mi>L</mi><mi>org</mi></msubsup><mrow><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>×</mo><msubsup><mi>gx</mi><mi>L</mi><mi>org</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></mrow></mtd></mtr><mtr><mtd><msubsup><mi>gx</mi><mi>L</mi><mi>org</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>×</mo><msubsup><mi>gy</mi><mi>L</mi><mi>org</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></mtd><mtd><msubsup><mi>gy</mi><mi>L</mi><mi>org</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>×</mo><msubsup><mi>gy</mi><mi>L</mi><mi>org</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></mtd><mtd><msubsup><mi>gz</mi><mi>L</mi><mi>org</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>×</mo><msubsup><mi>gy</mi><mi>L</mi><mi>org</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></mtd></mtr><mtr><mtd><msubsup><mi>gx</mi><mi>L</mi><mi>org</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>×</mo><msubsup><mi>gz</mi><mi>L</mi><mi>org</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></mtd><mtd><msubsup><mi>gy</mi><mi>L</mi><mi>org</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>×</mo><msubsup><mi>gz</mi><mi>L</mi><mi>org</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></mtd><mtd><msubsup><mi>gz</mi><mi>L</mi><mi>org</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>×</mo><msubsup><mi>gz</mi><mi>L</mi><mi>org</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></mtd></mtr></mtable></mfenced><mo>,</mo></mrow></math>]]></maths>根据{L<sub>dis</sub>(x,y)}中的每个像素点的水平方向梯度、垂直方向梯度和视点方向梯度,计算{L<sub>dis</sub>(x,y)}中的每个像素点的梯度结构张量,将{L<sub>dis</sub>(x,y)}中坐标位置为(x,y)的像素点的梯度结构张量记为Z<sub>dis</sub>(x,y),<maths num="0002"><![CDATA[<math><mrow><msub><mi>Z</mi><mi>dis</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>=</mo><mfenced open='[' close=']'><mtable><mtr><mtd><msubsup><mi>gx</mi><mi>L</mi><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>×</mo><msubsup><mi>gx</mi><mi>L</mi><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></mtd><mtd><msubsup><mi>gy</mi><mi>L</mi><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>×</mo><msubsup><mi>gx</mi><mi>L</mi><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></mtd><mtd><msubsup><mi>gz</mi><mi>L</mi><mi>dis</mi></msubsup><mrow><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>×</mo><msubsup><mi>gx</mi><mi>L</mi><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></mrow></mtd></mtr><mtr><mtd><msubsup><mi>gx</mi><mi>L</mi><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>×</mo><msubsup><mi>gy</mi><mi>L</mi><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></mtd><mtd><msubsup><mi>gy</mi><mi>L</mi><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>×</mo><msubsup><mi>gy</mi><mi>L</mi><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></mtd><mtd><msubsup><mi>gz</mi><mi>L</mi><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>×</mo><msubsup><mi>gy</mi><mi>L</mi><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></mtd></mtr><mtr><mtd><msubsup><mi>gx</mi><mi>L</mi><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>×</mo><msubsup><mi>gz</mi><mi>L</mi><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></mtd><mtd><msubsup><mi>gy</mi><mi>L</mi><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>×</mo><msubsup><mi>gz</mi><mi>L</mi><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></mtd><mtd><msubsup><mi>gz</mi><mi>L</mi><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>×</mo><msubsup><mi>gz</mi><mi>L</mi><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></mtd></mtr></mtable></mfenced><mo>,</mo></mrow></math>]]></maths>其中,符号“[]”表示矩阵表示符号;⑤根据{L<sub>org</sub>(x,y)}和{L<sub>dis</sub>(x,y)}中的每个像素点的梯度结构张量,计算{L<sub>dis</sub>(x,y)}中的每个像素点的客观评价度量值,将{L<sub>dis</sub>(x,y)}中坐标位置为(x,y)的像素点的客观评价度量值记为Q<sub>L</sub>(x,y);⑥根据{L<sub>dis</sub>(x,y)}中的每个像素点的区域类型,计算S<sub>dis</sub>的图像质量客观评价预测值,记为Q,<img file="FDA00001726599800023.GIF" wi="415" he="171" />其中,<img file="FDA00001726599800024.GIF" wi="66" he="50" />表示{L<sub>dis</sub>(x,y)}中的区域类型为p=1的像素点的个数,<img file="FDA00001726599800025.GIF" wi="66" he="50" />表示{L<sub>dis</sub>(x,y)}中的所有区域类型为p=1的像素点构成的区域;⑦采用n幅原始的无失真的立体图像,建立其在不同失真类型不同失真程度下的失真立体图像集合,该失真立体图像集合包括多幅失真的立体图像,利用主观质量评价方法分别获取失真立体图像集合中每幅失真的立体图像的平均主观评分差值,记为DMOS,DMOS=100-MOS,其中,MOS表示主观评分均值,DMOS∈[0,100],n≥1;⑧按照步骤①至步骤⑥计算S<sub>dis</sub>的图像质量客观评价预测值的操作,分别计算失真立体图像集合中每幅失真的立体图像的图像质量客观评价预测值。 |