发明名称 一种基于空域和时域结构相似性的视频质量客观评价方法
摘要 本发明公开了一种基于空域和时域结构相似性的视频质量客观评价方法,其从空域和时域两个方面评价失真视频和参考视频之间的结构相似度,其中空域评价包括亮度和色度的结构相似性,而时域评价则使用帧间残差的结构相似性来表示,计算简单快捷;然后利用四元数矩阵来建立结构相似度评价模型;再采用奇异值分解方法求解结构相似度四元数矩阵,得到最终的客观质量评价值;优点是计算复杂度低,且能够有效地提高客观评价结果与主观感知的相关性。
申请公布号 CN104023227A 申请公布日期 2014.09.03
申请号 CN201410232487.6 申请日期 2014.05.28
申请人 宁波大学 发明人 李纲;艾孜买提;金炜;杨斌斌
分类号 H04N17/00(2006.01)I 主分类号 H04N17/00(2006.01)I
代理机构 宁波奥圣专利代理事务所(普通合伙) 33226 代理人 周珏
主权项 一种基于空域和时域结构相似性的视频质量客观评价方法,其特征在于包括以下步骤:①假设参考视频中的所有参考图像和失真视频中的所有失真图像的尺寸大小均为W×H,其中,W表示参考视频中的所有参考图像和失真视频中的所有失真图像的宽,H表示参考视频中的所有参考图像和失真视频中的所有失真图像的高;②将参考视频中当前待处理的参考图像定义为当前参考图像,并将失真视频中当前待处理的失真图像定义为当前失真图像;③假设当前参考图像为参考视频中的第m帧参考图像,并记为<img file="FDA0000512376550000011.GIF" wi="116" he="76" />同样假设当前失真图像为失真视频中的第m帧失真图像,并记为<img file="FDA0000512376550000012.GIF" wi="106" he="84" />其中,pre+1≤m≤M,m的初始值为pre+1,pre表示参考视频中时域上先于<img file="FDA0000512376550000013.GIF" wi="92" he="77" />的参考图像的总帧数,pre亦表示失真视频中时域上先于<img file="FDA0000512376550000014.GIF" wi="78" he="75" />的参考图像的总帧数,1≤pre≤9,M表示参考视频中包含的参考图像的总帧数,亦表示失真视频中包含的失真图像的总帧数;④假设<img file="FDA0000512376550000015.GIF" wi="80" he="78" />和<img file="FDA0000512376550000016.GIF" wi="73" he="77" />的尺寸大小刚好能够被8×8整除,分别将<img file="FDA0000512376550000017.GIF" wi="75" he="76" />和<img file="FDA0000512376550000018.GIF" wi="79" he="79" />分割成<img file="FDA0000512376550000019.GIF" wi="152" he="130" />个互不重叠的尺寸大小为8×8的图像块;⑤计算<img file="FDA00005123765500000110.GIF" wi="87" he="76" />和<img file="FDA00005123765500000111.GIF" wi="75" he="84" />中所有坐标位置相同的两个图像块之间的以四元数表示的基于空域和时域的结构相似度,将<img file="FDA00005123765500000112.GIF" wi="92" he="76" />中的第n个图像块和<img file="FDA00005123765500000113.GIF" wi="66" he="78" />中的第n个图像块之间的以四元数表示的基于空域和时域的结构相似度记为<img file="FDA00005123765500000114.GIF" wi="279" he="82" /><maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msubsup><mi>Q</mi><mi>m</mi><mrow><mi>org</mi><mo>,</mo><mi>dis</mi></mrow></msubsup><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>=</mo><msubsup><mi>residual</mi><mi>m</mi><mrow><mi>org</mi><mo>,</mo><mi>dis</mi></mrow></msubsup><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>+</mo><mi>i</mi><mrow><mo>(</mo><msubsup><mi>ch</mi><mi>m</mi><mrow><mi>org</mi><mo>,</mo><mi>dis</mi></mrow></msubsup><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>+</mo><mi>j</mi><mrow><mo>(</mo><msubsup><mi>c</mi><mi>m</mi><mrow><mi>org</mi><mo>,</mo><mi>dis</mi></mrow></msubsup><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>+</mo><mi>k</mi><mrow><mo>(</mo><msubsup><mi>s</mi><mi>m</mi><mrow><mi>org</mi><mo>,</mo><mi>dis</mi></mrow></msubsup><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>,</mo></mrow>]]></math><img file="FDA00005123765500000115.GIF" wi="1590" he="98" /></maths>其中,<img file="FDA00005123765500000116.GIF" wi="324" he="129" />n的初始值为1,<img file="FDA00005123765500000117.GIF" wi="348" he="89" />表示<img file="FDA00005123765500000118.GIF" wi="95" he="73" />中的第n个图像块和<img file="FDA00005123765500000119.GIF" wi="61" he="84" />中的第n个图像块之间的基于时域的结构相似度,<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><msubsup><mi>residual</mi><mi>m</mi><mrow><mi>org</mi><mo>,</mo><mi>dis</mi></mrow></msubsup><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>=</mo><mi>&alpha;</mi><mo>&times;</mo><msub><mi>compare</mi><mi>lumi</mi></msub><mo>+</mo><mi>&beta;</mi><mo>&times;</mo><msub><mi>compare</mi><mi>chro</mi></msub><mo>,</mo></mrow>]]></math><img file="FDA00005123765500000120.GIF" wi="1072" he="85" /></maths>compare<sub>lumi</sub>表示<img file="FDA00005123765500000121.GIF" wi="81" he="76" />中的第n个图像块的亮度残差和<img file="FDA00005123765500000122.GIF" wi="86" he="80" />中的第n个图像块的亮度残差的比较值,compare<sub>chro</sub>表示<img file="FDA00005123765500000123.GIF" wi="85" he="77" />中的第n个图像块的色度残差和<img file="FDA00005123765500000124.GIF" wi="78" he="79" />中的第n个图像块的色度残差的比较值,α表示compare<sub>lumi</sub>的权重,β表示compare<sub>chro</sub>的权重,α+β=1,i,j,k均为四元数中的虚数单位,<img file="FDA0000512376550000021.GIF" wi="726" he="90" />构成<img file="FDA0000512376550000022.GIF" wi="88" he="78" />中的第n个图像块和<img file="FDA0000512376550000023.GIF" wi="80" he="82" />中的第n个图像块之间的基于空域的结构相似度,<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><msubsup><mi>ch</mi><mi>m</mi><mrow><mi>org</mi><mo>,</mo><mi>dis</mi></mrow></msubsup><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mn>2</mn><mo>&times;</mo><msubsup><mi>&mu;</mi><mi>m</mi><mi>org</mi></msubsup><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>&times;</mo><msubsup><mi>&mu;</mi><mi>m</mi><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow></mrow><mrow><msup><mrow><mo>(</mo><msubsup><mi>&mu;</mi><mi>m</mi><mi>org</mi></msubsup><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>)</mo></mrow><mn>2</mn></msup><mo>+</mo><msup><mrow><mo>(</mo><msubsup><mi>&mu;</mi><mi>m</mi><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>)</mo></mrow><mn>2</mn></msup></mrow></mfrac><mo>,</mo></mrow>]]></math><img file="FDA0000512376550000024.GIF" wi="779" he="176" /></maths><img file="FDA0000512376550000025.GIF" wi="162" he="89" />表示<img file="FDA0000512376550000026.GIF" wi="83" he="77" />中的第n个图像块中的所有像素点的色度值的平均值,<img file="FDA0000512376550000027.GIF" wi="165" he="83" />表示<img file="FDA0000512376550000028.GIF" wi="85" he="78" />中的第n个图像块中的所有像素点的色度值的平均值,<maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><msubsup><mi>c</mi><mi>m</mi><mrow><mi>org</mi><mo>,</mo><mi>dis</mi></mrow></msubsup><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mn>2</mn><mo>&times;</mo><msubsup><mi>&sigma;</mi><mi>m</mi><mi>org</mi></msubsup><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>&times;</mo><msubsup><mi>&sigma;</mi><mi>m</mi><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>+</mo><msub><mi>C</mi><mn>2</mn></msub></mrow><mrow><msup><mrow><mo>(</mo><msubsup><mi>&sigma;</mi><mi>m</mi><mi>org</mi></msubsup><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>)</mo></mrow><mn>2</mn></msup><mo>+</mo><msup><mrow><mo>(</mo><msubsup><mi>&sigma;</mi><mi>m</mi><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>)</mo></mrow><mn>2</mn></msup><mo>+</mo><msub><mi>C</mi><mn>2</mn></msub></mrow></mfrac><mo>,</mo></mrow>]]></math><img file="FDA0000512376550000029.GIF" wi="852" he="179" /></maths><img file="FDA00005123765500000210.GIF" wi="166" he="84" />表示<img file="FDA00005123765500000211.GIF" wi="96" he="77" />中的第n个图像块的亮度标准差,<img file="FDA00005123765500000212.GIF" wi="162" he="86" />表示<img file="FDA00005123765500000213.GIF" wi="85" he="84" />中的第n个图像块的亮度标准差,C<sub>2</sub>=(K<sub>2</sub>×L)<sup>2</sup>,K<sub>2</sub>为值较小的常数,L表示参考图像中的像素点和失真图像中的像素点的像素值的动态范围,<maths num="0005" id="cmaths0005"><math><![CDATA[<mrow><msubsup><mi>s</mi><mi>m</mi><mrow><mi>org</mi><mo>,</mo><mi>dis</mi></mrow></msubsup><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mn>2</mn><mo>&times;</mo><msubsup><mi>&sigma;</mi><mi>m</mi><mrow><mi>org</mi><mo>,</mo><mi>dis</mi></mrow></msubsup><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>+</mo><msub><mi>C</mi><mn>3</mn></msub></mrow><mrow><msubsup><mrow><msubsup><mi>&sigma;</mi><mi>m</mi><mi>org</mi></msubsup><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>&times;</mo><mi>&sigma;</mi></mrow><mi>m</mi><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>+</mo><msub><mi>C</mi><mn>3</mn></msub></mrow></mfrac><mo>,</mo></mrow>]]></math><img file="FDA00005123765500000214.GIF" wi="716" he="163" /></maths><img file="FDA00005123765500000215.GIF" wi="218" he="84" />表示<img file="FDA00005123765500000216.GIF" wi="80" he="76" />中的第n个图像块与<img file="FDA00005123765500000217.GIF" wi="63" he="78" />中的第n个图像块的亮度协方差,<img file="FDA00005123765500000218.GIF" wi="204" he="128" />⑥将<img file="FDA00005123765500000219.GIF" wi="81" he="75" />和<img file="FDA00005123765500000220.GIF" wi="81" he="84" />中所有坐标位置相同的两个图像块之间的以四元数表示的基于空域和时域的结构相似度组成一个用于表示<img file="FDA00005123765500000221.GIF" wi="76" he="76" />和<img file="FDA00005123765500000222.GIF" wi="73" he="79" />之间的基于空域和时域的结构相似度且维数为<img file="FDA00005123765500000223.GIF" wi="156" he="127" />维的四元数矩阵;然后对该四元数矩阵进行奇异值分解,得到一个奇异值向量,记为Q<sub>m</sub>;⑦将参考视频中下一帧待处理的参考图像作为当前参考图像,并将失真视频中下一帧待处理的失真图像作为当前失真图像,然后返回步骤③继续执行,直至参考视频中的最后一帧参考图像和失真视频中的最后一帧失真图像处理完毕,得到失真视频中除前pre帧失真图像外的每帧失真图像对应的奇异值向量;⑧根据失真视频中除前pre帧失真图像外的每帧失真图像对应的奇异值向量,计算失真视频的客观质量评价值,记为QSSIM,<img file="FDA00005123765500000224.GIF" wi="599" he="160" />其中,<maths num="0006" id="cmaths0006"><math><![CDATA[<mrow><msub><mi>wg</mi><mi>m</mi></msub><mo>=</mo><mfrac><mrow><munderover><mi>&Sigma;</mi><mrow><mi>u</mi><mo>=</mo><mn>1</mn></mrow><mi>W</mi></munderover><munderover><mi>&Sigma;</mi><mrow><mi>v</mi><mo>=</mo><mn>1</mn></mrow><mi>H</mi></munderover><mrow><mo>(</mo><msubsup><mi>P</mi><mi>m</mi><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>&times;</mo><msubsup><mi>P</mi><mrow><mi>m</mi><mo>-</mo><mn>1</mn></mrow><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>)</mo></mrow></mrow><mrow><munderover><mi>&Sigma;</mi><mrow><mi>u</mi><mo>=</mo><mn>1</mn></mrow><mi>W</mi></munderover><munderover><mi>&Sigma;</mi><mrow><mi>v</mi><mo>=</mo><mn>1</mn></mrow><mi>H</mi></munderover><msup><mrow><mo>(</mo><msubsup><mi>P</mi><mi>m</mi><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>)</mo></mrow><mn>2</mn></msup><mo>&times;</mo><munderover><mi>&Sigma;</mi><mrow><mi>u</mi><mo>=</mo><mn>1</mn></mrow><mi>W</mi></munderover><munderover><mi>&Sigma;</mi><mrow><mi>v</mi><mo>=</mo><mn>1</mn></mrow><mi>H</mi></munderover><msup><mrow><mo>(</mo><msubsup><mi>P</mi><mrow><mi>m</mi><mo>-</mo><mn>1</mn></mrow><mi>dis</mi></msubsup><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>)</mo></mrow><mn>2</mn></msup></mrow></mfrac><mo>,</mo></mrow>]]></math><img file="FDA00005123765500000225.GIF" wi="961" he="279" /></maths>1≤u≤W,1≤v≤H,<img file="FDA00005123765500000226.GIF" wi="207" he="87" />表示<img file="FDA00005123765500000227.GIF" wi="71" he="78" />中坐标位置为(u,v)的像素点的亮度值,<img file="FDA0000512376550000031.GIF" wi="202" he="83" />表示失真视频中的第m‑1帧失真图像<img file="FDA0000512376550000032.GIF" wi="98" he="78" />中坐标位置为(u,v)的像素点的亮度值,<img file="FDA0000512376550000033.GIF" wi="699" he="228" />Q<sub>m</sub>(n)表示Q<sub>m</sub>中的第n个分量。
地址 315211 浙江省宁波市江北区风华路818号