发明名称 一种基于梯度结构张量的立体图像质量客观评价方法
摘要 本发明公开了一种基于梯度结构张量的立体图像质量客观评价方法,其首先通过计算立体图像的左视点图像中的每个像素点的水平梯度、垂直梯度和视点梯度,计算每个像素点的梯度结构张量,并通过矩阵分解得到每个像素点的梯度结构张量的特征值和特征向量,然后通过区域检测法将左视点图像划分成敏感区域和非敏感区域,最后根据每个像素的区域类型,得到最终的图像质量客观评价预测值,优点在于所得到的梯度结构张量的特征值和特性向量具有较强的稳定性且能够较好地反映立体图像的质量变化情况,并且只对敏感区域的像素点进行评价,能有效地提高客观评价结果与主观感知的相关性。
申请公布号 CN102737380A 申请公布日期 2012.10.17
申请号 CN201210187815.6 申请日期 2012.06.05
申请人 宁波大学 发明人 邵枫;段芬芳;郁梅;蒋刚毅;李福
分类号 G06T7/00(2006.01)I 主分类号 G06T7/00(2006.01)I
代理机构 宁波奥圣专利代理事务所(普通合伙) 33226 代理人 周珏
主权项 1.一种基于梯度结构张量的立体图像质量客观评价方法,其特征在于包括以下步骤:①令S<sub>org</sub>为原始的无失真的立体图像,令S<sub>dis</sub>为待评价的失真的立体图像,将S<sub>org</sub>的左视点图像记为{L<sub>org</sub>(x,y)},将S<sub>org</sub>的右视点图像记为{R<sub>org</sub>(x,y)},将S<sub>dis</sub>的左视点图像记为{L<sub>dis</sub>(x,y)},将S<sub>dis</sub>的右视点图像记为{R<sub>dis</sub>(x,y)},其中,(x,y)表示左视点图像和右视点图像中的像素点的坐标位置,1≤x≤W,1≤y≤H,W表示左视点图像和右视点图像的宽度,H表示左视点图像和右视点图像的高度,L<sub>org</sub>(x,y)表示{L<sub>org</sub>(x,y)}中坐标位置为(x,y)的像素点的像素值,R<sub>org</sub>(x,y)表示{R<sub>org</sub>(x,y)}中坐标位置为(x,y)的像素点的像素值,L<sub>dis</sub>(x,y)表示{L<sub>dis</sub>(x,y)}中坐标位置为(x,y)的像素点的像素值,R<sub>dis</sub>(x,y)表示{R<sub>dis</sub>(x,y)}中坐标位置为(x,y)的像素点的像素值;②计算{L<sub>org</sub>(x,y)}中的每个像素点的水平方向梯度、垂直方向梯度和视点方向梯度,将{L<sub>org</sub>(x,y)}中坐标位置为(x,y)的像素点的水平方向梯度记为<img file="FDA00001726599800011.GIF" wi="225" he="50" />将{L<sub>org</sub>(x,y)}中坐标位置为(x,y)的像素点的垂直方向梯度记为<img file="FDA00001726599800012.GIF" wi="226" he="50" />将{L<sub>org</sub>(x,y)}中坐标位置为(x,y)的像素点的视点方向梯度记为<img file="FDA00001726599800013.GIF" wi="224" he="50" />计算{L<sub>dis</sub>(x,y)}中的每个像素点的水平方向梯度、垂直方向梯度和视点方向梯度,将{L<sub>dis</sub>(x,y)}中坐标位置为(x,y)的像素点的水平方向梯度记为<img file="FDA00001726599800014.GIF" wi="221" he="56" />将{L<sub>dis</sub>(x,y)}中坐标位置为(x,y)的像素点的垂直方向梯度记为<img file="FDA00001726599800015.GIF" wi="221" he="55" />将{L<sub>dis</sub>(x,y)}中坐标位置为(x,y)的像素点的视点方向梯度记为<img file="FDA00001726599800016.GIF" wi="216" he="55" />③利用区域检测算法分别获取{L<sub>dis</sub>(x,y)}中的每个像素点的区域类型,记为p,其中,p∈{1,2},p=1表示敏感区域,p=2表示非敏感区域;④根据{L<sub>org</sub>(x,y)}中的每个像素点的水平方向梯度、垂直方向梯度和视点方向梯度,计算{L<sub>org</sub>(x,y)}中的每个像素点的梯度结构张量,将{L<sub>org</sub>(x,y)}中坐标位置为(x,y)的像素点的梯度结构张量记为Z<sub>org</sub>(x,y),<maths num="0001"><![CDATA[<math><mrow><msub><mi>Z</mi><mi>org</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>=</mo><mfenced open='[' close=']'><mtable><mtr><mtd><msubsup><mi>gx</mi><mi>L</mi><mi>org</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>&times;</mo><msubsup><mi>gx</mi><mi>L</mi><mi>org</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></mtd><mtd><msubsup><mi>gy</mi><mi>L</mi><mi>org</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>&times;</mo><msubsup><mi>gx</mi><mi>L</mi><mi>org</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></mtd><mtd><msubsup><mi>gz</mi><mi>L</mi><mi>org</mi></msubsup><mrow><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>&times;</mo><msubsup><mi>gx</mi><mi>L</mi><mi>org</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></mrow></mtd></mtr><mtr><mtd><msubsup><mi>gx</mi><mi>L</mi><mi>org</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>&times;</mo><msubsup><mi>gy</mi><mi>L</mi><mi>org</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></mtd><mtd><msubsup><mi>gy</mi><mi>L</mi><mi>org</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>&times;</mo><msubsup><mi>gy</mi><mi>L</mi><mi>org</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></mtd><mtd><msubsup><mi>gz</mi><mi>L</mi><mi>org</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>&times;</mo><msubsup><mi>gy</mi><mi>L</mi><mi>org</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></mtd></mtr><mtr><mtd><msubsup><mi>gx</mi><mi>L</mi><mi>org</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>&times;</mo><msubsup><mi>gz</mi><mi>L</mi><mi>org</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></mtd><mtd><msubsup><mi>gy</mi><mi>L</mi><mi>org</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>&times;</mo><msubsup><mi>gz</mi><mi>L</mi><mi>org</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></mtd><mtd><msubsup><mi>gz</mi><mi>L</mi><mi>org</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>&times;</mo><msubsup><mi>gz</mi><mi>L</mi><mi>org</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></mtd></mtr></mtable></mfenced><mo>,</mo></mrow></math>]]></maths>根据{L<sub>dis</sub>(x,y)}中的每个像素点的水平方向梯度、垂直方向梯度和视点方向梯度,计算{L<sub>dis</sub>(x,y)}中的每个像素点的梯度结构张量,将{L<sub>dis</sub>(x,y)}中坐标位置为(x,y)的像素点的梯度结构张量记为Z<sub>dis</sub>(x,y),<maths num="0002"><![CDATA[<math><mrow><msub><mi>Z</mi><mi>dis</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>=</mo><mfenced open='[' close=']'><mtable><mtr><mtd><msubsup><mi>gx</mi><mi>L</mi><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>&times;</mo><msubsup><mi>gx</mi><mi>L</mi><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></mtd><mtd><msubsup><mi>gy</mi><mi>L</mi><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>&times;</mo><msubsup><mi>gx</mi><mi>L</mi><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></mtd><mtd><msubsup><mi>gz</mi><mi>L</mi><mi>dis</mi></msubsup><mrow><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>&times;</mo><msubsup><mi>gx</mi><mi>L</mi><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></mrow></mtd></mtr><mtr><mtd><msubsup><mi>gx</mi><mi>L</mi><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>&times;</mo><msubsup><mi>gy</mi><mi>L</mi><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></mtd><mtd><msubsup><mi>gy</mi><mi>L</mi><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>&times;</mo><msubsup><mi>gy</mi><mi>L</mi><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></mtd><mtd><msubsup><mi>gz</mi><mi>L</mi><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>&times;</mo><msubsup><mi>gy</mi><mi>L</mi><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></mtd></mtr><mtr><mtd><msubsup><mi>gx</mi><mi>L</mi><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>&times;</mo><msubsup><mi>gz</mi><mi>L</mi><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></mtd><mtd><msubsup><mi>gy</mi><mi>L</mi><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>&times;</mo><msubsup><mi>gz</mi><mi>L</mi><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></mtd><mtd><msubsup><mi>gz</mi><mi>L</mi><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>&times;</mo><msubsup><mi>gz</mi><mi>L</mi><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></mtd></mtr></mtable></mfenced><mo>,</mo></mrow></math>]]></maths>其中,符号“[]”表示矩阵表示符号;⑤根据{L<sub>org</sub>(x,y)}和{L<sub>dis</sub>(x,y)}中的每个像素点的梯度结构张量,计算{L<sub>dis</sub>(x,y)}中的每个像素点的客观评价度量值,将{L<sub>dis</sub>(x,y)}中坐标位置为(x,y)的像素点的客观评价度量值记为Q<sub>L</sub>(x,y);⑥根据{L<sub>dis</sub>(x,y)}中的每个像素点的区域类型,计算S<sub>dis</sub>的图像质量客观评价预测值,记为Q,<img file="FDA00001726599800023.GIF" wi="415" he="171" />其中,<img file="FDA00001726599800024.GIF" wi="66" he="50" />表示{L<sub>dis</sub>(x,y)}中的区域类型为p=1的像素点的个数,<img file="FDA00001726599800025.GIF" wi="66" he="50" />表示{L<sub>dis</sub>(x,y)}中的所有区域类型为p=1的像素点构成的区域;⑦采用n幅原始的无失真的立体图像,建立其在不同失真类型不同失真程度下的失真立体图像集合,该失真立体图像集合包括多幅失真的立体图像,利用主观质量评价方法分别获取失真立体图像集合中每幅失真的立体图像的平均主观评分差值,记为DMOS,DMOS=100-MOS,其中,MOS表示主观评分均值,DMOS∈[0,100],n≥1;⑧按照步骤①至步骤⑥计算S<sub>dis</sub>的图像质量客观评价预测值的操作,分别计算失真立体图像集合中每幅失真的立体图像的图像质量客观评价预测值。
地址 315211 浙江省宁波市江北区风华路818号