发明名称 结合多视差和运动的立体视频舒适度评价方法
摘要 结合多视差和运动的立体视频舒适度评价方法属立体视频视觉舒适度评价技术领域,本发明提出了将物体的三种视差与物体的运动特性作为影响立体视频舒适度重要因素;提取帧内显著物体视差、帧内相关背景视差、帧间视差和运动变量这四个对立体视频舒适度有影响的因素,合成视差图并提取水平视差,计算深度视差;结合深度感知理论和最小二乘拟和方法建立主观评价与四大因素的函数关系,得到立体视频舒适度评价模型,再利用主观评价的方法对模型进行评定;本发明提出了一种新的对立体视频舒适度评价的方法,所建立的模型可以很好地模拟人眼的主观感受,对于研究人眼观看立体视频的舒适度有重要意义。
申请公布号 CN104853185A 申请公布日期 2015.08.19
申请号 CN201510308249.3 申请日期 2015.06.06
申请人 吉林大学 发明人 王世刚;姜秀红;王晓燕;武伟;赵文婷;赵晓琳;鲁奉军;霍昊达;孙飞飞
分类号 H04N17/00(2006.01)I;H04N13/00(2006.01)I 主分类号 H04N17/00(2006.01)I
代理机构 长春吉大专利代理有限责任公司 22201 代理人 邵铭康;朱世林
主权项 一种结合多视差与运动的立体视频视觉舒适度评价方法,其特征在于包括下列步骤:1.1提取影响立体视频舒适度的多种视差与运动量,具体包括下列步骤:1.1.1帧内显著物体区域的提取:选取进行实验的视频序列第T帧左、右立体视图,利用谱分析算法进行处理,得到显著物体区域的分布图;1.1.2帧内相关背景区域的提取:用场景相关的显著区域提取法对立体视频第T帧左、右立体视图进行处理,得到帧内相关背景区域图;1.1.3帧内视差提取:首先选取第T帧左、右两幅匹配视图,求出其标准视差图,然后将得到的标准视差图分别与步骤1.1.1中所提取的显著物体区域、步骤1.1.2中提取的帧内相关背景区域结合,得到帧内显著物体视差图、帧内相关背景视差图后,提取水平视差,计算视差深度;1.1.4帧间视差提取:选取视频序列的左视图,用块匹配法得到帧间标准视差图,提取水平视差,计算视差深度;1.1.5运动量提取:利用步骤1.1.1中显著物体提取方式,提取第T帧与第T+1帧的左视图的显著物体区域进行融合,再结合步骤1.1.4中的帧间标准视差图进行运动量的提取;1.2建立结合视差与运动的立体视频视觉舒适度的评价模型,具体包括下列步骤:1.2.1对实验场景和实验片源的要求:实验场景中设定屏幕与观测者间的观测距离L为屏幕高度H的3倍;实验片源采用由国际视频组织发布的标准立体视频序列,播放间隔设定为20s;1.2.2对观测者的要求:观测者无对观测结果产生影响的眼部疾病;双目裸视或佩戴眼镜矫正视力需要达到1.0;年龄为20‑‑35岁的男性和女性;分为普通人和有相关经验的专家;佩戴主动快门眼镜无不良反应;1.2.3获取主观评价的实验结果:由观测者根据立体视频视觉舒适度的5个等级,对国际标准立体视频序列进行评分,获得人类主观评价得分MOS值;1.2.4计算相关视差深度:根据水平视差的定义和立体感原理,水平视差<img file="FDA0000732858380000011.GIF" wi="248" he="133" />得到相应的视差深度d为:<img file="FDA0000732858380000012.GIF" wi="247" he="142" />由此计算步骤1.1.3所提取的帧内显著物体视差、相关背景视差,以及步骤1.1.4的帧间视差对应的视差深度d<sub>n</sub>、d<sub>b</sub>、d<sub>j</sub>;上述公式中:L为步骤1.2.1所设定的已知量,s为瞳距65mm,d<sub>s</sub>是在忽略掉垂直视差的情况下,相邻帧两幅视图的水平视差;1.2.5计算运动量:根据步骤1.1.5中运动量的大小设定阈值,进行运动量区间的划分;1.2.6根据步骤1.2.3主观评价的实验结果与步骤1.2.4中得到的帧内显著区域视差d<sub>n</sub>、帧内相关背景视差d<sub>b</sub>、帧间视差d<sub>j</sub>以及步骤1.2.5所述的运动量进行最小二乘拟合,确定立体视频视觉舒适度评价与四种影响因素的关系函数式为:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>V</mi><mrow><mi>c</mi><mn>1</mn></mrow></msub><mo>=</mo><msub><mi>a</mi><mn>0</mn></msub><msubsup><mi>d</mi><mi>n</mi><mn>3</mn></msubsup><mo>+</mo><msub><mi>a</mi><mn>1</mn></msub><msubsup><mi>d</mi><mi>n</mi><mn>2</mn></msubsup><mo>+</mo><msub><mi>a</mi><mn>2</mn></msub><msub><mi>d</mi><mi>n</mi></msub><mo>+</mo><msub><mi>a</mi><mn>3</mn></msub><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000732858380000021.GIF" wi="1117" he="83" /></maths><maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><msub><mi>V</mi><mrow><mi>c</mi><mn>2</mn></mrow></msub><mo>=</mo><msub><mi>b</mi><mn>0</mn></msub><mo>*</mo><msup><mi>e</mi><mrow><msub><mi>b</mi><mn>1</mn></msub><mo>*</mo><msub><mi>d</mi><mi>b</mi></msub></mrow></msup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000732858380000022.GIF" wi="1148" he="79" /></maths><maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><msub><mi>V</mi><mrow><mi>c</mi><mn>3</mn></mrow></msub><mo>=</mo><msub><mi>c</mi><mn>0</mn></msub><mo>+</mo><msub><mi>c</mi><mn>1</mn></msub><mo>*</mo><msqrt><mfrac><msub><mi>d</mi><mi>j</mi></msub><mi>v</mi></mfrac></msqrt><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000732858380000023.GIF" wi="1149" he="155" /></maths>1.2.7根据人眼立体视觉特性和对立体视频的评价经验,对步骤1.2.6中得到的影响舒适度各因素的函数分别进行加权处理;得到相应的视觉舒适度评分函数模型VC:<maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><mi>VC</mi><mo>=</mo><msub><mi>w</mi><mn>1</mn></msub><mrow><mo>(</mo><msub><mi>a</mi><mn>0</mn></msub><msubsup><mi>d</mi><mi>n</mi><mn>3</mn></msubsup><mo>+</mo><msub><mi>a</mi><mn>1</mn></msub><msubsup><mi>d</mi><mi>n</mi><mn>2</mn></msubsup><mo>+</mo><msub><mi>a</mi><mn>2</mn></msub><msub><mi>d</mi><mi>n</mi></msub><mo>+</mo><msub><mi>a</mi><mn>3</mn></msub><mo>)</mo></mrow><mo>+</mo><msub><mi>w</mi><mn>2</mn></msub><mrow><mo>(</mo><msub><mi>b</mi><mn>0</mn></msub><mo>*</mo><msup><mi>e</mi><mrow><msub><mi>b</mi><mn>1</mn></msub><mo>*</mo><msub><mi>d</mi><mi>b</mi></msub></mrow></msup><mo>)</mo></mrow><mo>+</mo><msub><mi>w</mi><mn>3</mn></msub><mrow><mo>(</mo><msub><mi>c</mi><mn>0</mn></msub><mo>+</mo><msub><mi>c</mi><mn>1</mn></msub><mo>*</mo><msqrt><mfrac><msub><mi>d</mi><mi>j</mi></msub><mi>v</mi></mfrac></msqrt><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>4</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000732858380000024.GIF" wi="1532" he="156" /></maths>1.2.6和1.2.7步骤的(1)、(2)、(3)、(4)式中:V<sub>c1</sub>,V<sub>c2</sub>,V<sub>c3</sub>分别为帧内显著物体、帧内相关背景、帧间视差以及物体运动与评分由最小二乘拟合得到的函数关系式;VC为视觉舒适度评分;w<sub>1</sub>,w<sub>2</sub>,w<sub>3</sub>是根据视觉特性赋予的经验权值,其值分别为0.7,0.2,0.1;d<sub>n</sub>为帧内显著区域视差;d<sub>b</sub>为帧内相关背景视差;d<sub>j</sub>为帧间视差;v为运动变量;a<sub>0</sub>、a<sub>1</sub>、a<sub>2</sub>、a<sub>3</sub>、b<sub>0</sub>、b<sub>1</sub>、c<sub>0</sub>、c<sub>1</sub>为进行最小二乘拟合时得到的系数。
地址 130012 吉林省长春市前进大街2699号
您可能感兴趣的专利