发明名称 一种基于三维离散余弦变换的立体视频质量客观评价方法
摘要 本发明公开了一种基于三维离散余弦变换的立体视频质量客观评价方法,其考虑到人眼对立体视频的感知过程中左视点视频和右视点视频权重的不确定性,将在立体视频的左视点图像和右视点图像中进行块匹配,组合成立体块,利用三维离散余弦变换能够有效提取视频左右视点帧对的特点,将立体块通过三维离散余弦变换提取部分系数进行质量评价,得到最终的立体视频质量,有效地提高了客观评价结果与主观感知之间的相关性。
申请公布号 CN104243974A 申请公布日期 2014.12.24
申请号 CN201410464325.5 申请日期 2014.09.12
申请人 宁波大学 发明人 蒋刚毅;唐先伟;郑凯辉;宋洋;郁梅
分类号 H04N17/00(2006.01)I;H04N13/00(2006.01)I 主分类号 H04N17/00(2006.01)I
代理机构 宁波奥圣专利代理事务所(普通合伙) 33226 代理人 周珏
主权项 一种基于三维离散余弦变换的立体视频质量客观评价方法,其特征在于包括以下步骤:①令I<sub>org</sub>表示原始的无失真的立体视频,令I<sub>dis</sub>表示待评价的失真的立体视频;②将I<sub>org</sub>中当前待处理的立体图像定义为当前无失真立体图像,将I<sub>dis</sub>中当前待处理的立体图像定义为当前失真立体图像;③假设当前无失真立体图像为I<sub>org</sub>中的第f帧立体图像,并记为<img file="FDA0000569486940000011.GIF" wi="103" he="83" />同时假设当前失真立体图像为I<sub>dis</sub>中的第f帧立体图像,并记为<img file="FDA0000569486940000012.GIF" wi="87" he="84" />将<img file="FDA0000569486940000013.GIF" wi="77" he="87" />的左视点图像和右视点图像对应记为<img file="FDA0000569486940000014.GIF" wi="83" he="84" />和<img file="FDA0000569486940000015.GIF" wi="110" he="85" />将<img file="FDA0000569486940000016.GIF" wi="72" he="78" />的左视点图像和右视点图像对应记为<img file="FDA0000569486940000017.GIF" wi="68" he="78" />和<img file="FDA0000569486940000018.GIF" wi="106" he="77" />其中,1≤f≤N,f的初始值为1,N表示I<sub>org</sub>和I<sub>dis</sub>中各自包含的立体图像的总帧数;④将<img file="FDA0000569486940000019.GIF" wi="78" he="85" />划分成<img file="FDA00005694869400000110.GIF" wi="151" he="128" />个互不重叠的尺寸大小为8×8的第一图像块,以尺寸大小为8×8的滑动窗口在<img file="FDA00005694869400000111.GIF" wi="75" he="85" />中逐像素点移动将<img file="FDA00005694869400000112.GIF" wi="78" he="85" />划分成(W‑7)×(H‑7)个相重叠的尺寸大小为8×8的第二图像块,然后以<img file="FDA00005694869400000113.GIF" wi="81" he="85" />中的每个第一图像块为一个基准块,在<img file="FDA00005694869400000114.GIF" wi="84" he="84" />中找出每个基准块的最佳匹配块,再计算每个基准块与其最佳匹配块的差异块,假设以<img file="FDA00005694869400000115.GIF" wi="86" he="82" />中坐标位置为(u,v)的第一图像块为基准块时,在<img file="FDA00005694869400000116.GIF" wi="82" he="85" />中找出的该基准块的最佳匹配块为<img file="FDA00005694869400000117.GIF" wi="89" he="89" />中坐标位置为(u',v')的第二图像块,则将以<img file="FDA00005694869400000118.GIF" wi="69" he="82" />中坐标位置为(u,v)的第一图像块为基准块时该基准块与其最佳匹配块的差异块记为<img file="FDA00005694869400000131.GIF" wi="150" he="103" /><img file="FDA00005694869400000120.GIF" wi="475" he="105" />其中,W表示I<sub>org</sub>和I<sub>dis</sub>中包含的立体图像的宽度,H表示I<sub>org</sub>和I<sub>dis</sub>中包含的立体图像的高度,并假设W和H刚好能够被8整除,<img file="FDA00005694869400000121.GIF" wi="448" he="129" />1≤u'≤W‑7,1≤v'≤H‑7,符号“||”为取绝对值符号,<img file="FDA00005694869400000122.GIF" wi="115" he="92" />表示<img file="FDA00005694869400000123.GIF" wi="73" he="83" />中坐标位置为(u,v)的第一图像块,<img file="FDA00005694869400000124.GIF" wi="119" he="92" />表示<img file="FDA00005694869400000125.GIF" wi="86" he="85" />中坐标位置为(u',v')的第二图像块,<img file="FDA00005694869400000126.GIF" wi="133" he="92" />为在<img file="FDA00005694869400000127.GIF" wi="77" he="83" />中找出的<img file="FDA00005694869400000128.GIF" wi="119" he="92" />的最佳匹配块;同样,将<img file="FDA00005694869400000129.GIF" wi="70" he="83" />划分成<img file="FDA00005694869400000130.GIF" wi="147" he="134" />个互不重叠的尺寸大小为8×8的第一图像块,以尺寸大小为8×8的滑动窗口在<img file="FDA0000569486940000021.GIF" wi="71" he="81" />中逐像素点移动将<img file="FDA0000569486940000022.GIF" wi="73" he="82" />划分成(W‑7)×(H‑7)个相重叠的尺寸大小为8×8的第二图像块,然后以<img file="FDA0000569486940000023.GIF" wi="74" he="77" />中的每个第一图像块为一个基准块,在<img file="FDA0000569486940000024.GIF" wi="81" he="76" />中找出每个基准块的最佳匹配块,再计算每个基准块与其最佳匹配块的差异块,假设以<img file="FDA0000569486940000025.GIF" wi="74" he="80" />中坐标位置为(u,v)的第一图像块为基准块时,在<img file="FDA0000569486940000026.GIF" wi="71" he="82" />中找出的该基准块的最佳匹配块为<img file="FDA0000569486940000027.GIF" wi="79" he="83" />中坐标位置为(u',v')的第二图像块,则将以<img file="FDA0000569486940000028.GIF" wi="79" he="79" />中坐标位置为(u,v)的第一图像块为基准块时该基准块与其最佳匹配块的差异块记为<img file="FDA0000569486940000029.GIF" wi="145" he="94" /><img file="FDA00005694869400000210.GIF" wi="462" he="106" />其中,<img file="FDA00005694869400000211.GIF" wi="450" he="132" />1≤u'≤W‑7,1≤v'≤H‑7,符号“||”为取绝对值符号,<img file="FDA00005694869400000212.GIF" wi="112" he="91" />表示<img file="FDA00005694869400000213.GIF" wi="70" he="79" />中坐标位置为(u,v)的第一图像块,<img file="FDA00005694869400000214.GIF" wi="126" he="98" />表示<img file="FDA00005694869400000215.GIF" wi="71" he="82" />中坐标位置为(u',v')的第二图像块,<img file="FDA00005694869400000216.GIF" wi="121" he="93" />为在<img file="FDA00005694869400000217.GIF" wi="77" he="77" />中找出的<img file="FDA00005694869400000218.GIF" wi="119" he="87" />的最佳匹配块;⑤根据<img file="FDA00005694869400000219.GIF" wi="73" he="82" />中的每个第一图像块、<img file="FDA00005694869400000220.GIF" wi="81" he="85" />中的每个第一图像块对应的差异块及<img file="FDA00005694869400000221.GIF" wi="83" he="80" />中的每个第一图像块对应的最佳匹配块,获取<img file="FDA00005694869400000222.GIF" wi="73" he="87" />中的每个第一图像块对应的长×宽×高为8×8×3的无失真立体块,将<img file="FDA00005694869400000223.GIF" wi="77" he="85" />中坐标位置为(u,v)的第一图像块<img file="FDA00005694869400000224.GIF" wi="108" he="88" />对应的无失真立体块记为<img file="FDA00005694869400000225.GIF" wi="281" he="79" />为<img file="FDA00005694869400000226.GIF" wi="279" he="90" />和<img file="FDA00005694869400000227.GIF" wi="126" he="91" />从上到下依次叠放组成;同样,根据<img file="FDA00005694869400000228.GIF" wi="75" he="72" />中的每个第一图像块、<img file="FDA00005694869400000229.GIF" wi="82" he="81" />中的每个第一图像块对应的差异块及<img file="FDA00005694869400000230.GIF" wi="71" he="80" />中的每个第一图像块对应的最佳匹配块,获取<img file="FDA00005694869400000231.GIF" wi="72" he="77" />中的每个第一图像块对应的长×宽×高为8×8×3的失真立体块,将<img file="FDA00005694869400000232.GIF" wi="76" he="71" />中坐标位置为(u,v)的第一图像块<img file="FDA00005694869400000233.GIF" wi="105" he="90" />对应的失真立体块记为<img file="FDA00005694869400000234.GIF" wi="273" he="85" />为<img file="FDA00005694869400000235.GIF" wi="265" he="92" />和<img file="FDA00005694869400000236.GIF" wi="120" he="89" />从上到下依次叠放组成;⑥对<img file="FDA00005694869400000237.GIF" wi="87" he="84" />中的每个第一图像块对应的无失真立体块进行三维离散余弦变换,得到<img file="FDA00005694869400000238.GIF" wi="86" he="85" />中的每个第一图像块对应的无失真立体块的系数矩阵,将<img file="FDA00005694869400000239.GIF" wi="111" he="84" />的系数矩阵记为<img file="FDA00005694869400000240.GIF" wi="148" he="82" />同样,对<img file="FDA00005694869400000241.GIF" wi="67" he="83" />中的每个第一图像块对应的失真立体块进行三维离散余弦变换,得到<img file="FDA00005694869400000242.GIF" wi="75" he="76" />中的每个第一图像块对应的失真立体块的系数矩阵,将<img file="FDA00005694869400000243.GIF" wi="108" he="83" />的系数矩阵记为<img file="FDA00005694869400000244.GIF" wi="137" he="84" />⑦根据<img file="FDA00005694869400000245.GIF" wi="83" he="91" />中的每个第一图像块对应的无失真立体块的系数矩阵中的部分系数和<img file="FDA00005694869400000246.GIF" wi="76" he="77" />中的每个第一图像块对应的失真立体块的系数矩阵中的部分系数,计算<img file="FDA00005694869400000247.GIF" wi="71" he="73" />中的每个第一图像块对应的失真立体块相对于<img file="FDA00005694869400000248.GIF" wi="80" he="83" />中相同坐标位置的第一图像块对应的无失真立体块的块质量,将<img file="FDA0000569486940000031.GIF" wi="106" he="85" />相对于<img file="FDA0000569486940000032.GIF" wi="113" he="85" />的块质量记为<img file="FDA0000569486940000033.GIF" wi="134" he="85" /><img file="FDA0000569486940000034.GIF" wi="649" he="213" /><maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msubsup><mi>&tau;</mi><mrow><mn>1</mn><mo>,</mo><mi>org</mi><mo>,</mo><mi>f</mi></mrow><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow></msubsup><mo>=</mo><mn>0.0625</mn><mo>&times;</mo><msubsup><mi>F</mi><mrow><mi>org</mi><mo>,</mo><mi>f</mi></mrow><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow></msubsup><mrow><mo>(</mo><mn>1</mn><mo>,</mo><mn>1</mn><mo>,</mo><mn>1</mn><mo>)</mo></mrow><mo>,</mo><msubsup><mi>&tau;</mi><mrow><mn>2</mn><mo>,</mo><mi>org</mi><mo>,</mo><mi>f</mi></mrow><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow></msubsup><mo>=</mo><mn>0.0909</mn><mo>&times;</mo><msubsup><mi>F</mi><mrow><mi>org</mi><mo>,</mo><mi>f</mi></mrow><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow></msubsup><mrow><mo>(</mo><mn>1,2,1</mn><mo>)</mo></mrow><mo>,</mo><msubsup><mi>&tau;</mi><mrow><mn>3</mn><mo>,</mo><mi>org</mi><mo>,</mo><mi>f</mi></mrow><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow></msubsup><mo>=</mo><mn>0.0833</mn><mo>&times;</mo><msubsup><mi>F</mi><mrow><mi>org</mi><mo>,</mo><mi>f</mi></mrow><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow></msubsup><mrow><mo>(</mo><mn>2,1,1</mn><mo>)</mo></mrow><mo>,</mo></mrow>]]></math><img file="FDA0000569486940000035.GIF" wi="1956" he="85" /></maths><img file="FDA0000569486940000036.GIF" wi="517" he="86" />和<img file="FDA0000569486940000037.GIF" wi="238" he="80" />对应表示<img file="FDA0000569486940000038.GIF" wi="106" he="84" />中下标为(1,1,1)、(1,2,1)和(2,1,1)的系数的值,<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><msubsup><mi>&tau;</mi><mrow><mn>1</mn><mo>,</mo><mi>dis</mi><mo>,</mo><mi>f</mi></mrow><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow></msubsup><mo>=</mo><mn>0.0625</mn><mo>&times;</mo><msubsup><mi>F</mi><mrow><mi>dis</mi><mo>,</mo><mi>f</mi></mrow><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow></msubsup><mrow><mo>(</mo><mn>1</mn><mo>,</mo><mn>1</mn><mo>,</mo><mn>1</mn><mo>)</mo></mrow><mo>,</mo><msubsup><mi>&tau;</mi><mrow><mn>2</mn><mo>,</mo><mi>dis</mi><mo>,</mo><mi>f</mi></mrow><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow></msubsup><mo>=</mo><mn>0.0909</mn><mo>&times;</mo><msubsup><mi>F</mi><mrow><mi>dis</mi><mo>,</mo><mi>f</mi></mrow><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow></msubsup><mrow><mo>(</mo><mn>1,2,1</mn><mo>)</mo></mrow><mo>,</mo></mrow>]]></math><img file="FDA0000569486940000039.GIF" wi="1389" he="85" /></maths><maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><msubsup><mi>&tau;</mi><mrow><mn>3</mn><mo>,</mo><mi>dis</mi><mo>,</mo><mi>f</mi></mrow><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow></msubsup><mo>=</mo><mn>0.0833</mn><mo>&times;</mo><msubsup><mi>F</mi><mrow><mi>dis</mi><mo>,</mo><mi>f</mi></mrow><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow></msubsup><mrow><mo>(</mo><mn>2,1,1</mn><mo>)</mo></mrow><mo>,</mo></mrow>]]></math><img file="FDA00005694869400000310.GIF" wi="619" he="87" /></maths><img file="FDA00005694869400000311.GIF" wi="534" he="80" />和<img file="FDA00005694869400000312.GIF" wi="238" he="85" />对应表示<img file="FDA00005694869400000313.GIF" wi="110" he="92" />中下标为(1,1,1)、(1,2,1)和(2,1,1)的系数的值;⑧根据<img file="FDA00005694869400000314.GIF" wi="76" he="74" />中的每个第一图像块对应的失真立体块相对于<img file="FDA00005694869400000315.GIF" wi="79" he="81" />中相同坐标位置的第一图像块对应的无失真立体块的块质量,计算<img file="FDA00005694869400000316.GIF" wi="70" he="82" />相对于<img file="FDA00005694869400000317.GIF" wi="80" he="89" />的帧质量,记为Q<sub>f</sub>,<maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><msub><mi>Q</mi><mi>f</mi></msub><mo>=</mo><mfrac><mrow><munderover><mi>&Sigma;</mi><mrow><mi>u</mi><mo>=</mo><mn>1</mn></mrow><mfrac><mi>W</mi><mn>8</mn></mfrac></munderover><munderover><mi>&Sigma;</mi><mrow><mi>v</mi><mo>=</mo><mn>1</mn></mrow><mfrac><mi>H</mi><mn>8</mn></mfrac></munderover><mrow><mo>(</mo><msubsup><mi>Q</mi><mi>f</mi><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow></msubsup><mo>&times;</mo><msup><mi>w</mi><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow></msup><mo>)</mo></mrow></mrow><mrow><munderover><mi>&Sigma;</mi><mrow><mi>u</mi><mo>=</mo><mn>1</mn></mrow><mfrac><mi>W</mi><mn>8</mn></mfrac></munderover><munderover><mi>&Sigma;</mi><mrow><mi>v</mi><mo>=</mo><mn>1</mn></mrow><mfrac><mi>H</mi><mn>8</mn></mfrac></munderover><msup><mi>w</mi><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow></msup></mrow></mfrac><mo>,</mo></mrow>]]></math><img file="FDA00005694869400000318.GIF" wi="559" he="352" /></maths>其中,w<sup>(u,v)</sup>表示<img file="FDA00005694869400000319.GIF" wi="106" he="84" />的权重;⑨将I<sub>org</sub>中下一帧待处理的立体图像作为当前无失真立体图像,将I<sub>dis</sub>中下一帧待处理的立体图像作为当前失真立体图像,然后返回步骤③继续执行,直至I<sub>org</sub>和I<sub>dis</sub>中的所有立体图像处理完毕;⑩计算I<sub>dis</sub>相对于I<sub>org</sub>的质量,记为Q,<img file="FDA00005694869400000320.GIF" wi="342" he="290" />其中,T<sub>f</sub>表示<img file="FDA00005694869400000321.GIF" wi="64" he="72" />的时域加权权重。
地址 315211 浙江省宁波市江北区风华路818号