发明名称 基于时空显著性检测的视频融合性能评价方法
摘要 本发明公开了一种基于时空显著性检测的视频融合性能评价方法,主要解决现有技术不能有效对含噪声视频的融合性能进行评价的问题。其实现步骤为:分别输入已配准的两个参考视频和一个融合视频;对参考视频利用三维时空结构张量进行时空显著性检测,将视频划分为时空特征区域和噪声区域,然后针对时空特征区域和噪声区域分别设计不同的评价指标进行评价;最后通过取平均构建出整体性能评价指标,从而实现对含噪声视频整体融合性能的评价。本发明能够对含噪声视频的融合性能进行有效、准确和客观地评价,可用于监控融合视频图像质量或设定视频融合算法的最佳参数。
申请公布号 CN103873859A 申请公布日期 2014.06.18
申请号 CN201410114553.X 申请日期 2014.03.26
申请人 西安电子科技大学 发明人 张强;华胜;袁小青;王龙
分类号 H04N17/00(2006.01)I 主分类号 H04N17/00(2006.01)I
代理机构 陕西电子工业专利中心 61205 代理人 王品华;朱红星
主权项 1.一种基于时空显著性检测的视频融合性能评价方法,包括如下步骤:(1)分别输入两幅参考视频a、b以及融合视频f,并分别构建第一参考视频a每个像素点处的三维时空结构张量矩阵S<sub>a</sub>(x,y,t)、第二参考视频b每个像素点处的三维时空结构张量矩阵S<sub>b</sub>(x,y,t)和融合视频f每个像素点处的三维时空结构张量矩阵S<sub>f</sub>(x,y,t);(2)利用两幅参考视频的三维时空结构张量矩阵进行时空显著性检测,得到每幅参考视频的时空特征区域R<sub>1</sub>和噪声区域R<sub>2</sub>;(3)对时空特征区域像素的融合性能进行评价:3.1)分别计算第一参考视频a、第二参考视频b、融合视频f在每个像素点处的三维时空结构张量矩阵的最大特征值,得到第一参考视频a的结构张量最大特征值视频λ<sub>a</sub>、第二参考视频b的结构张量最大特征值视频λ<sub>b</sub>、融合视频f的结构张量最大特征值视频λ<sub>f</sub>;3.2)根据第一参考视频a的结构张量最大特征值视频λ<sub>a</sub>和融合视频f的结构张量最大特征值视频λ<sub>f</sub>,得到第一参考视频a和融合视频f对应时空特征区域像素的时空特征评价指标Q<sub>af</sub>(x,y,t):<maths num="0001"><![CDATA[<math><mrow><msub><mi>Q</mi><mi>af</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>,</mo><mi>t</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><msub><mrow><mn>4</mn><mi>&sigma;</mi></mrow><mi>af</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>,</mo><mi>t</mi><mo>)</mo></mrow><mover><mrow><msub><mi>&lambda;</mi><mi>a</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>,</mo><mi>t</mi><mo>)</mo></mrow></mrow><mo>&OverBar;</mo></mover><mover><mrow><msub><mi>&lambda;</mi><mi>f</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>,</mo><mi>t</mi><mo>)</mo></mrow></mrow><mo>&OverBar;</mo></mover></mrow><mrow><mrow><mo>(</mo><msubsup><mi>&sigma;</mi><mi>a</mi><mn>2</mn></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>,</mo><mi>t</mi><mo>)</mo></mrow><mo>+</mo><msubsup><mi>&sigma;</mi><mi>f</mi><mn>2</mn></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>,</mo><mi>t</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>[</mo><msup><mrow><mo>(</mo><mover><mrow><msub><mi>&lambda;</mi><mi>a</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>,</mo><mi>t</mi><mo>)</mo></mrow></mrow><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mn>2</mn></msup><mo>+</mo><msup><mrow><mo>(</mo><mover><mrow><msub><mi>&lambda;</mi><mi>f</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>,</mo><mi>t</mi><mo>)</mo></mrow></mrow><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mn>2</mn></msup><mo>]</mo></mrow></mfrac><mo>,</mo></mrow></math>]]></maths>其中,<img file="FDA0000482141710000012.GIF" wi="203" he="83" />和σ<sub>a</sub>(x,y,t)分别表示第一参考视频a的结构张量最大特征值视频λ<sub>a</sub>中,以当前被评价的时空特征区域像素为中心的3×3×3局部区域内的灰度平均值和标准差;<img file="FDA0000482141710000013.GIF" wi="208" he="82" />和σ<sub>f</sub>(x,y,t)分别表示融合视频f的结构张量最大特征值视频λ<sub>f</sub>中,以当前被评价的时空特征区域像素为中心的3×3×3局部区域内的灰度平均值和标准差;σ<sub>af</sub>(x,y,t)表示第一参考视频a的结构张量最大特征值视频λ<sub>a</sub>和融合视频f的结构张量最大特征值视频λ<sub>f</sub>中,以当前被评价的时空特征区域像素为中心的3×3×3局部区域内的灰度协方差,(x,y)表示空间坐标,t表示时间坐标;3.3)根据第二参考视频b的结构张量最大特征值视频λ<sub>b</sub>和融合视频f的结构张量最大特征值视频λ<sub>f</sub>,得到第二参考视频b和融合视频f对应时空特征区域像素的时空特征评价指标Q<sub>bf</sub>(x,y,t):<maths num="0002"><![CDATA[<math><mrow><msub><mi>Q</mi><mi>bf</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>,</mo><mi>t</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><msub><mrow><mn>4</mn><mi>&sigma;</mi></mrow><mi>bf</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>,</mo><mi>t</mi><mo>)</mo></mrow><mover><mrow><msub><mi>&lambda;</mi><mi>b</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>,</mo><mi>t</mi><mo>)</mo></mrow></mrow><mo>&OverBar;</mo></mover><mover><mrow><msub><mi>&lambda;</mi><mi>f</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>,</mo><mi>t</mi><mo>)</mo></mrow></mrow><mo>&OverBar;</mo></mover></mrow><mrow><mrow><mo>(</mo><msubsup><mi>&sigma;</mi><mi>b</mi><mn>2</mn></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>,</mo><mi>t</mi><mo>)</mo></mrow><mo>+</mo><msubsup><mi>&sigma;</mi><mi>f</mi><mn>2</mn></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>,</mo><mi>t</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>[</mo><msup><mrow><mo>(</mo><mover><mrow><msub><mi>&lambda;</mi><mi>b</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>,</mo><mi>t</mi><mo>)</mo></mrow></mrow><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mn>2</mn></msup><mo>+</mo><msup><mrow><mo>(</mo><mover><mrow><msub><mi>&lambda;</mi><mi>f</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>,</mo><mi>t</mi><mo>)</mo></mrow></mrow><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mn>2</mn></msup><mo>]</mo></mrow></mfrac><mo>,</mo></mrow></math>]]></maths>其中,<img file="FDA0000482141710000022.GIF" wi="203" he="84" />和σ<sub>b</sub>(x,y,t)分别表示第二参考视频b的结构张量最大特征值视频λ<sub>b</sub>中,以当前被评价的时空特征区域像素为中心的3×3×3局部区域内的灰度平均值和标准差;<img file="FDA0000482141710000023.GIF" wi="210" he="89" />和σ<sub>f</sub>(x,y,t)分别表示融合视频f的结构张量最大特征值视频λ<sub>f</sub>中,以当前被评价的时空特征区域像素为中心的3×3×3局部区域内的灰度平均值和标准差;σ<sub>bf</sub>(x,y,t)表示第二参考视频b的结构张量最大特征值视频λ<sub>b</sub>和融合视频f的结构张量最大特征值视频λ<sub>f</sub>中,以当前被评价的时空特征区域像素为中心的3×3×3局部区域内的灰度协方差;(x,y)表示空间坐标,t表示时间坐标;3.4)将上述两个参考视频的时空特征评价指标Q<sub>af</sub>(x,y,t)和Q<sub>bf</sub>(x,y,t)进行加权平均,得到时空特征区域像素的时空特征融合性能评价指标Q<sub>f</sub>(x,y,t);(4)对噪声区域像素的融合性能进行评价:4.1)分别计算第一参考视频a、第二参考视频b、融合视频f在每个像素点处的三维时空结构张量矩阵的最小特征值,得到第一参考视频a的结构张量最小特征值视频η<sub>a</sub>、第二参考视频b的结构张量最小特征值视频η<sub>b</sub>、融合视频f的结构张量最小特征值视频η<sub>f</sub>;4.2)根据第一参考视频a的结构张量最小特征值视频η<sub>a</sub>和融合视频f的结构张量最小特征值视频η<sub>f</sub>,得到第一参考视频a和融合视频f对应噪声区域像素的噪声评价指标N<sub>af</sub>(x,y,t):<maths num="0003"><![CDATA[<math><mrow><msub><mi>N</mi><mi>af</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>,</mo><mi>t</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><msub><mrow><mn>4</mn><mi>&delta;</mi></mrow><mi>af</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>,</mo><mi>t</mi><mo>)</mo></mrow><mover><mrow><msub><mi>&eta;</mi><mi>a</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>,</mo><mi>t</mi><mo>)</mo></mrow></mrow><mo>&OverBar;</mo></mover><mover><mrow><msub><mi>&eta;</mi><mi>f</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>,</mo><mi>t</mi><mo>)</mo></mrow></mrow><mo>&OverBar;</mo></mover></mrow><mrow><mrow><mo>(</mo><msubsup><mi>&delta;</mi><mi>a</mi><mn>2</mn></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>,</mo><mi>t</mi><mo>)</mo></mrow><mo>+</mo><msubsup><mi>&delta;</mi><mi>f</mi><mn>2</mn></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>,</mo><mi>t</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>[</mo><msup><mrow><mo>(</mo><mover><mrow><msub><mi>&eta;</mi><mi>a</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>,</mo><mi>t</mi><mo>)</mo></mrow></mrow><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mn>2</mn></msup><mo>+</mo><msup><mrow><mo>(</mo><mover><mrow><msub><mi>&eta;</mi><mi>f</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>,</mo><mi>t</mi><mo>)</mo></mrow></mrow><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mn>2</mn></msup><mo>]</mo></mrow></mfrac><mo>,</mo></mrow></math>]]></maths>其中,<img file="FDA0000482141710000032.GIF" wi="209" he="84" />和δ<sub>a</sub>(x,y,t)分别表示第一参考视频a的结构张量最小特征值视频η<sub>a</sub>中,以当前被评价的噪声区域像素为中心的3×3×3局部区域内的灰度平均值和标准差;<img file="FDA0000482141710000033.GIF" wi="211" he="89" />和δ<sub>f</sub>(x,y,t)分别表示融合视频f的结构张量最小特征值视频η<sub>f</sub>中,以当前被评价的噪声区域像素为中心的3×3×3局部区域内的灰度平均值和标准差;δ<sub>af</sub>(x,y,t)表示第一参考视频a的结构张量最小特征值视频η<sub>a</sub>和融合视频f的结构张量最小特征值视频η<sub>f</sub>中,以当前被评价的噪声区域像素为中心的3×3×3局部区域内的灰度协方差;(x,y)表示空间坐标,t表示时间坐标;4.3)根据第二参考视频b的结构张量最小特征值视频η<sub>b</sub>和融合视频f的结构张量最小特征值视频η<sub>f</sub>,得到第二参考视频b和融合视频f对应噪声区域像素的噪声评价指标N<sub>bf</sub>(x,y,t):<maths num="0004"><![CDATA[<math><mrow><msub><mi>N</mi><mi>bf</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>,</mo><mi>t</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><msub><mrow><mn>4</mn><mi>&delta;</mi></mrow><mi>bf</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>,</mo><mi>t</mi><mo>)</mo></mrow><mover><mrow><msub><mi>&eta;</mi><mi>b</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>,</mo><mi>t</mi><mo>)</mo></mrow><mi></mi></mrow><mo>&OverBar;</mo></mover><mover><mrow><msub><mi>&eta;</mi><mi>f</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>,</mo><mi>t</mi><mo>)</mo></mrow></mrow><mo>&OverBar;</mo></mover></mrow><mrow><mrow><mo>(</mo><msubsup><mi>&delta;</mi><mi>b</mi><mn>2</mn></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>,</mo><mi>t</mi><mo>)</mo></mrow><mo>+</mo><msubsup><mi>&delta;</mi><mi>f</mi><mn>2</mn></msubsup><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>,</mo><mi>t</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>[</mo><msup><mrow><mo>(</mo><mover><mrow><msub><mi>&eta;</mi><mi>b</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>,</mo><mi>t</mi><mo>)</mo></mrow></mrow><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mn>2</mn></msup><mo>+</mo><msup><mrow><mo>(</mo><mover><mrow><msub><mi>&eta;</mi><mi>f</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>,</mo><mi>t</mi><mo>)</mo></mrow></mrow><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mn>2</mn></msup><mo>]</mo></mrow></mfrac><mo>,</mo></mrow></math>]]></maths>其中,<img file="FDA0000482141710000035.GIF" wi="204" he="84" />和δ<sub>b</sub>(x,y,t)分别表示第二参考视频b的结构张量最小特征值视频η<sub>b</sub>中,以当前被评价的噪声区域像素为中心的3×3×3局部区域内的灰度平均值和标准差;<img file="FDA0000482141710000036.GIF" wi="213" he="89" />和δ<sub>f</sub>(x,y,t)分别表示融合视频f的结构张量最小特征值视频η<sub>f</sub>中,以当前被评价的噪声区域像素为中心的3×3×3局部区域内的灰度平均值和标准差;δ<sub>bf</sub>(x,y,t)表示第二参考视频b的结构张量最小特征值视频η<sub>b</sub>和融合视频f的结构张量最小特征值视频η<sub>f</sub>中,以当前被评价的噪声区域像素为中心的3×3×3局部区域内的灰度协方差;(x,y)表示空间坐标,t表示时间坐标;4.4)将上述两个参考视频的噪声评价指标N<sub>af</sub>(x,y,t)和N<sub>bf</sub>(x,y,t)按如下方式结合,得到噪声区域像素的噪声抑制评价指标Q<sub>n</sub>(x,y,t):<maths num="0005"><![CDATA[<math><mrow><msub><mi>Q</mi><mi>n</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>,</mo><mi>t</mi><mo>)</mo></mrow><mo>=</mo><mn>1</mn><mo>-</mo><mfrac><mrow><msub><mi>N</mi><mi>af</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>,</mo><mi>t</mi><mo>)</mo></mrow><mo>+</mo><msub><mi>N</mi><mi>bf</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>,</mo><mi>t</mi><mo>)</mo></mrow></mrow><mn>2</mn></mfrac><mo>,</mo></mrow></math>]]></maths>其中,(x,y)表示空间坐标,t表示时间坐标;(5)将时空特征区域像素的时空特征融合性能评价指标Q<sub>f</sub>(x,y,t)与噪声区域像素的噪声抑制评价指标Q<sub>n</sub>(x,y,t)结合,得到视频融合的整体融合性能评价指标Q<sub>stfn</sub>:<maths num="0006"><![CDATA[<math><mrow><msub><mi>Q</mi><mi>stfn</mi></msub><mo>=</mo><mfrac><mn>1</mn><mi>T</mi></mfrac><mo>&CenterDot;</mo><munderover><mi>&Sigma;</mi><mrow><mi>t</mi><mo>=</mo><mn>1</mn></mrow><mi>T</mi></munderover><mfrac><mrow><mo>(</mo><msub><mi>&Sigma;</mi><mrow><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>&Element;</mo><msub><mi>R</mi><mn>1</mn></msub></mrow></msub><msub><mi>Q</mi><mi>f</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>,</mo><mi>t</mi><mo>)</mo></mrow><mo>+</mo><msub><mi>&Sigma;</mi><mrow><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>&Element;</mo><msub><mi>R</mi><mn>2</mn></msub></mrow></msub><msub><mi>Q</mi><mi>n</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>,</mo><mi>t</mi><mo>)</mo></mrow><mo>)</mo></mrow><mrow><mi>K</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></mrow></mfrac><mo>,</mo></mrow></math>]]></maths>其中,(x,y)表示空间坐标,t表示时间坐标,K(t)表示第t帧图像中时空特征区域像素和噪声区域像素个数之和,T表示处理的视频图像帧数。
地址 710071 陕西省西安市太白南路2号