发明名称 一种立体图像的人眼最小可辨变化分析方法
摘要 本发明公开了一种立体图像的人眼最小可辨变化分析方法,通过广义线性模型框架下的Thurstone模型对观察者主观评价数据进行回归分析,以在左视点图像质量固定不变的情况下,测定人眼可感知立体图像质量变化时右视点图像质量下降的临界值,从而确定非对称立体视频编码时右视点图像质量相对左视点图像质量可下降的最大变化范围,使得既能通过降低右视点图像质量来达到提高编码效率的目的,又能利用立体视觉掩蔽效应使观察者不能感知到右视点图像质量下降的事实,从而保证了立体图像的整体质量。
申请公布号 CN101795411A 申请公布日期 2010.08.04
申请号 CN201010121958.8 申请日期 2010.03.10
申请人 宁波大学 发明人 蒋刚毅;王旭;郁梅
分类号 H04N7/26(2006.01)I;H04N7/50(2006.01)I;H04N13/00(2006.01)I 主分类号 H04N7/26(2006.01)I
代理机构 宁波奥圣专利代理事务所(普通合伙) 33226 代理人 程晓明
主权项 1.一种立体图像的人眼最小可辨变化分析方法,其特征在于包括以下步骤:①首先取一幅立体图像作为测试图像,然后利用H.264视频编码标准,采用一个预设的编码量化参数对测试图像的左视点图像以帧内编码方式进行编码,记对测试图像的左视点图像进行编码所采用的预设的编码量化参数为QP<sub>L</sub>,将编码得到的左视点图像定义为A质量点的左视点图像,记为L<sub>A</sub>,再采用N个不同的编码量化参数分别对测试图像的右视点图像以帧内编码方式进行编码,获得所需的N幅质量各不相同的右视点图像,其中,对测试图像的右视点图像进行编码所采用的N个不同的编码量化参数分别为QP<sub>L</sub>-1、QP<sub>L</sub>、QP<sub>L</sub>+1、QP<sub>L</sub>+2、……,如果(51-(QP<sub>L</sub>-1)+1)>15,则N=15,否则,N=51-(QP<sub>L</sub>-1)+1;②从采用编码量化参数QP<sub>L</sub>-1、QP<sub>L</sub>、QP<sub>L</sub>+1进行编码得到的3幅质量各不相同的右视点图像中选取一幅采用客观质量评价标准评价时质量与A质量点的左视点图像L<sub>A</sub>的质量最为接近的右视点图像,并将该选定的右视点图像定义为A质量点的右视点图像,记为R<sub>A</sub>,将A质量点的右视点图像R<sub>A</sub>编码采用的编码量化参数记为QP<sub>RA</sub>,将A质量点的左视点图像L<sub>A</sub>和A质量点的右视点图像R<sub>A</sub>所构成的最优立体图像记为S<sub>AA</sub>;记N幅质量各不相同的右视点图像中编码量化参数大于QP<sub>RA</sub>的右视点图像的数量为M幅,将A质量点的左视点图像L<sub>A</sub>与M幅采用大于QP<sub>RA</sub>的编码量化参数编码得到的右视点图像一一构成M幅立体图像,记为S<sub>m</sub>,1≤m≤M,S<sub>m</sub>为由A质量点的左视点图像L<sub>A</sub>和采用编码量化参数QP<sub>RA</sub>+m编码得到的右视点图像所构成的立体图像;③组织参与进行图像主观质量评价的观察者若干名,先将m=1时的立体图像S<sub>m</sub>作为当前待评价立体图像,然后将内容相同但质量不同的最优立体图像S<sub>AA</sub>和当前待评价立体图像S<sub>m</sub>同时播放在屏幕上,要求每位观察者对这2幅立体图像的质量进行独立评价,看观察者是否能辨别出这2幅立体图像的质量差异,并记录下每位观察者对这2幅立体图像的质量的评价结果,再将m加1后的立体图像S<sub>m</sub>作为当前待评价立体图像,重复上述评价过程,直至m>M时结束评价过程;根据所有观察者的评价结果选择B、C、D、E另外4个质量点的右视点图像,选择方法如下:如果立体图像S<sub>m</sub>与最优立体图像S<sub>AA</sub>对比后大多数观察者都不能分辨出该S<sub>m</sub>与S<sub>AA</sub>的质量差异,则将该S<sub>m</sub>对应的右视点图像定义为B质量点的右视点图像,记为R<sub>B</sub>,并将该立体图像S<sub>m</sub>记为S<sub>AB</sub>,将B质量点的右视点图像R<sub>B</sub>编码采用的编码量化参数记为QP<sub>RB</sub>;如果立体图像S<sub>m</sub>与立体图像S<sub>AA</sub>对比后大多数观察者都可以分辨出该S<sub>m</sub>与S<sub>AA</sub>的质量差异,则将该S<sub>m</sub>对应的右视点图像定义为E质量点的右视点图像,记为R<sub>E</sub>,并将该立体图像S<sub>m</sub>记为S<sub>AE</sub>,将E质量点的右视点图像R<sub>E</sub>编码采用的编码量化参数记为QP<sub>RE</sub>;再在B质量点的右视点图像R<sub>B</sub>与E质量点的右视点图像R<sub>E</sub>之间等量化步长选取C质量点的右视点图像和D质量点的右视点图像,将C质量点的右视点图像记为R<sub>C</sub>,将C质量点的右视点图像R<sub>C</sub>编码采用的编码量化参数记为QP<sub>RC</sub>,将D质量点的右视点图像记为R<sub>D</sub>,将D质量点的右视点图像R<sub>D</sub>编码采用的编码量化参数记为QP<sub>RD</sub>,(QP<sub>RB</sub>-QP<sub>RC</sub>)≈(QP<sub>RC</sub>-QP<sub>RD</sub>)≈(QP<sub>RD</sub>-QP<sub>RE</sub>),将A质量点的左视点图像L<sub>A</sub>和C质量点的右视点图像R<sub>C</sub>所构成的立体图像记为S<sub>AC</sub>,将A质量点的左视点图像L<sub>A</sub>和D质量点的右视点图像R<sub>D</sub>所构成的立体图像记为S<sub>AD</sub>;④将经上述步骤获得的5幅质量逐次递减的立体图像S<sub>AA</sub>、S<sub>AB</sub>、S<sub>AC</sub>、S<sub>AD</sub>和S<sub>AE</sub>两两组合,共组成十组不同的立体图像对比组合,分别为S<sub>AA</sub> S<sub>AB</sub>、S<sub>AA</sub> S<sub>AC</sub>、S<sub>AA</sub> S<sub>AD</sub>、S<sub>AA</sub> S<sub>AE</sub>、S<sub>AB</sub> S<sub>AC</sub>、S<sub>AB</sub> S<sub>AD</sub>、S<sub>AB</sub> S<sub>AE</sub>、S<sub>AC</sub> S<sub>AD</sub>、S<sub>AC</sub> S<sub>AE</sub>和S<sub>AD</sub> S<sub>AE</sub>;随机播放这十组立体图像对比组合,要求每位观察者分别对所有立体图像对比组合中的2幅立体图像两两对比进行独立的主观质量评价,指出其认为立体图像对比组合中的2幅立体图像质量相对较好的立体图像,并记录评价数据;⑤对于十组立体图像对比组合中的其中一组立体图像对比组合,令Q<sub>i</sub>和Q<sub>j</sub>分别表示该立体图像对比组合中的2幅立体图像分别对应的2幅不同的右视点图像的质量点,Q<sub>i</sub>∈{A,B,C,D,E},Q<sub>j</sub>∈{A,B,C,D,E},且Q<sub>i</sub>≠Q<sub>j</sub>;然后根据记录的评价数据统计出参与图像主观质量评价的观察者认为Q<sub>i</sub>质量点的右视点图像对应的立体图像的质量高于Q<sub>j</sub>质量点的右视点图像对应的立体图像的质量的概率,记为p<sub>ij</sub>,表示比例为p<sub>ij</sub>的观察者认为Q<sub>i</sub>质量点的右视点图像对应的立体图像的质量高于Q<sub>j</sub>质量点的右视点图像对应的立体图像的质量;再根据十组立体图像对比组合各自的概率p<sub>ij</sub>,构造十组立体图像对比组合的偏好概率矩阵;⑥根据偏好概率矩阵构造适用于建立广义线性模型框架下的Thurstone模型所需的回归矩阵,其中,回归矩阵的总行数为10行,每一行对应一组立体图像对比组合,每行包括7项数据,分别记为N、A<sub>s</sub>、B<sub>s</sub>、C<sub>s</sub>、D<sub>s</sub>、E<sub>s</sub>、p,其中,N为参与对该组立体图像对比组合进行主观质量评价的观察者人数,A<sub>s</sub>、B<sub>s</sub>、C<sub>s</sub>、D<sub>s</sub>、E<sub>s</sub>分别对应于由A质量点的左视点图像L<sub>A</sub>和A、B、C、D、E 5个质量点的右视点图像分别构成的立体图像S<sub>AA</sub>、S<sub>AB</sub>、S<sub>AC</sub>、S<sub>AD</sub>和S<sub>AE</sub>,对于回归矩阵中的其中一行,如果A<sub>s</sub>、B<sub>s</sub>、C<sub>s</sub>、D<sub>s</sub>、E<sub>s</sub>5项中的3项值为0,1项值为1,另1项值为-1,则表示该行数据反映的是非零的2项所对应的2幅立体图像的主观评价结果,p为偏好概率,表示参与评价的N名观察者中有比例为p的观察者认为A<sub>s</sub>、B<sub>s</sub>、C<sub>s</sub>、D<sub>s</sub>、E<sub>s</sub>5项中值为1的项所对应的立体图像的质量要优于值为-1的项所对应的立体图像;⑦根据回归矩阵建立广义线性模型框架下的Thurstone模型,Thurstone模型的形式为:Φ<sup>-1</sup>(p)=a×A<sub>s</sub>+b×B<sub>s</sub>+c×C<sub>s</sub>+d×D<sub>s</sub>+e×E<sub>s</sub>,其中,a、b、c、d和e分别为对应于立体图像S<sub>AA</sub>、S<sub>AB</sub>、S<sub>AC</sub>、S<sub>AD</sub>和S<sub>AE</sub>的Z分数,且e=0,Φ<sup>-1</sup>(p)为二项分布的概率函数的反函数;然后将回归矩阵数据代入Thurstone模型进行回归分析得到a、b、c、d的估计值,分别记为a<sup>est</sup>、b<sup>est</sup>、c<sup>est</sup>和d<sup>est</sup>,并令e的估计值e<sup>est</sup>=e=0;⑧逐一计算Z分数对a和b、a和c、a和d及a和e的置信区间,Z分数对a和b的置信区间为a<sup>est</sup>-b<sup>est</sup>-BOUND<a-b<a<sup>est</sup>-b<sup>est</sup>+BOUND,Z分数对a和c的置信区间为a<sup>est</sup>-c<sup>est</sup>-BOUND<a-c<a<sup>est</sup>-c<sup>est</sup>+BOUND,Z分数对a和d的置信区间为a<sup>est</sup>-d<sup>est</sup>-BOUND<a-d<a<sup>est</sup>-d<sup>est</sup>+BOUND,Z分数对a和e的置信区间为a<sup>est</sup>-e<sup>est</sup>-BOUND<a-e<a<sup>est</sup>-e<sup>est</sup>+BOUND,<img file="FSA00000029339200031.GIF" wi="864" he="58" />χ<sub>dim</sub><sup>2</sup>为卡方分布,其自由度dim=4,α表示分位数,x表示相应的检验向量,x<sup>T</sup>为x的转置矩阵,COV为随机向量(a,b,c,d)的协方差矩阵;⑨按英文字母顺序排列b、c、d和e,依次判断Z分数对a和b、a和c、a和d及a和e的每一对中所对应的2幅立体图像的质量是否是可分辨的,具体过程如下:定义当前正在处理的Z分数对为a和q,q∈{b,c,d,e},判断数值0是否在区间(a<sup>est</sup>-q<sup>est</sup>-BOUND,a<sup>est</sup>-q<sup>est</sup>+BOUND)内,如果是,则认为a和q是不具有显著性差异的,表示a对应的最优立体图像S<sub>AA</sub>与由A质量点的左视点图像和q对应的质量点的右视点图像构成的立体图像S<sub>AQ</sub>之间的图像质量差异是不可分辨的,否则,认为a和q是具有显著性差异的,表示a对应的最优立体图像S<sub>AA</sub>与由A质量点的左视点图像和q对应的质量点的右视点图像构成的立体图像S<sub>AQ</sub>之间的图像质量差异是可分辨的,其中,Q∈{B,C,D,E};⑩如果a对应的最优立体图像S<sub>AA</sub>与由A质量点的左视点图像和q对应的质量点的右视点图像构成的立体图像S<sub>AQ</sub>之间的图像质量差异是可分辨的,而a对应的最优立体图像S<sub>AA</sub>与由A质量点的左视点图像和以英文字母顺序排在q对应的质量点之前的各个质量点所对应的右视点图像构成的立体图像之间的图像质量差异均是不可分辨的,则定义a对应的最优立体图像S<sub>AA</sub>与由A质量点的左视点图像和q对应的质量点的右视点图像构成的立体图像S<sub>AQ</sub>的信噪比差值为测试图像的左视点图像采用预设的编码量化参数QP<sub>L</sub>编码时的最小可辨变化值,其中,q∈{b,c,d,e}。
地址 315211 浙江省宁波市江北区风华路818号