发明名称 一种基于多摄像机的视频实时拼接方法
摘要 本发明公开了一种基于多摄像机的视频实时拼接方法,其步骤如下:获取同步多路视频数据;对同一时刻的帧图像进行预处理:把彩色图像变成灰度图像;进行图像增强处理,采用直方图均衡方法扩大图像灰度的动态范围;采用SURF算法进行对应帧特征点的提取;采用最近邻匹配法、随机抽样一致性匹配算法求出视频对应帧图像间匹配特征点对;求解视频初始k帧的最优单应性矩阵:根据匹配后的特征点对确定拼接重叠区域;把重叠区域相似度最大的帧对应的单应性矩阵作为最优的单应性矩阵,据此进行后继视频帧场景的拼接;输出拼接后的视频。本发明可以减少视频帧单帧图像拼接的计算量并提高交通监控视频拼接速度,达到实时处理效果。
申请公布号 CN102006425A 申请公布日期 2011.04.06
申请号 CN201010587394.7 申请日期 2010.12.13
申请人 交通运输部公路科学研究所 发明人 张春雨;齐彤岩;李斌;蔡胜昔;蔡蕾;汪林;孔涛
分类号 H04N5/262(2006.01)I;H04N7/18(2006.01)I 主分类号 H04N5/262(2006.01)I
代理机构 北京万科园知识产权代理有限责任公司 11230 代理人 杜澄心;张亚军
主权项 一种基于多摄像机的视频实时拼接方法,硬件是基于多摄像机的交通监控视频拼接装置,主要包括处理器、视频采集模块、电源模块、显示模块和存储模块;其步骤如下:步骤1、启动操作,获取同步多路视频数据;步骤2、对同一时刻的帧图像进行预处理:把彩色图像变成256灰度的灰度图像,并采用直方图均衡方法对图像进行增强处理;步骤3、采用SURF算法进行对应帧特征点的提取;步骤4、采用最近邻匹配法、随机抽样一致性匹配算法对视频图像对应帧的特征点对进行匹配;步骤5、求解视频初始k帧的最优单应性矩阵:步骤5‑1、确定拼接图像的重叠区域按照图像的透视映射关系,根据单应性矩阵得到保留特征点在另一对应帧图像的匹配点;如果计算出的匹配点没有落在图像内,说明这一点并不在两幅图像的重叠区内,反之,如果特征点映射前后都落在图像内,说明它处在重叠区内;用这种方法遍历一遍,即对一幅图像中所有保留特征点进行透视映射变换,得到映射对应特征点确定的区域;取以另一幅图像的边缘为边界,取重叠区的最小内接多边形作为重叠区域;步骤5‑2、求取前k帧对应图像拼接重叠区域的相似度相似度测度由归一化协方差相关函数来定义,如下公式1所述: <mrow> <mi>C</mi> <mrow> <mo>(</mo> <msub> <mi>I</mi> <mn>1</mn> </msub> <mo>,</mo> <msub> <mi>I</mi> <mn>2</mn> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <munderover> <mi>&Sigma;</mi> <mrow> <mi>m</mi> <mo>=</mo> <mn>0</mn> </mrow> <mi>w</mi> </munderover> <munderover> <mi>&Sigma;</mi> <mrow> <mi>n</mi> <mo>=</mo> <mn>0</mn> </mrow> <mi>h</mi> </munderover> <mo>[</mo> <msub> <mi>I</mi> <mn>1</mn> </msub> <mrow> <mo>(</mo> <msub> <mi>i</mi> <mn>1</mn> </msub> <mo>,</mo> <msub> <mi>j</mi> <mn>1</mn> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mover> <mrow> <msub> <mi>I</mi> <mn>1</mn> </msub> <mrow> <mo>(</mo> <msub> <mi>i</mi> <mn>1</mn> </msub> <mo>,</mo> <msub> <mi>j</mi> <mn>1</mn> </msub> <mo>)</mo> </mrow> </mrow> <mo>&OverBar;</mo> </mover> <mo>]</mo> <mo>&times;</mo> <mo>[</mo> <msub> <mi>I</mi> <mn>2</mn> </msub> <mrow> <mo>(</mo> <msub> <mi>i</mi> <mn>2</mn> </msub> <mo>,</mo> <msub> <mi>j</mi> <mn>2</mn> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mover> <mrow> <msub> <mi>I</mi> <mn>2</mn> </msub> <mrow> <mo>(</mo> <msub> <mi>i</mi> <mn>2</mn> </msub> <mo>,</mo> <msub> <mi>j</mi> <mn>2</mn> </msub> <mo>)</mo> </mrow> </mrow> <mo>&OverBar;</mo> </mover> <mo>]</mo> </mrow> <msqrt> <mo>{</mo> <munderover> <mi>&Sigma;</mi> <mrow> <mi>m</mi> <mo>=</mo> <mn>0</mn> </mrow> <mi>w</mi> </munderover> <munderover> <mi>&Sigma;</mi> <mrow> <mi>n</mi> <mo>=</mo> <mn>0</mn> </mrow> <mi>h</mi> </munderover> <msup> <mrow> <mo>[</mo> <msub> <mi>I</mi> <mn>1</mn> </msub> <mrow> <mo>(</mo> <msub> <mi>i</mi> <mn>1</mn> </msub> <mo>,</mo> <msub> <mi>j</mi> <mn>1</mn> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mover> <mrow> <msub> <mi>I</mi> <mn>1</mn> </msub> <mrow> <mo>(</mo> <msub> <mi>i</mi> <mn>1</mn> </msub> <mo>,</mo> <msub> <mi>j</mi> <mn>1</mn> </msub> <mo>)</mo> </mrow> </mrow> <mo>&OverBar;</mo> </mover> <mo>]</mo> </mrow> <mn>2</mn> </msup> <mo>}</mo> <mo>&times;</mo> <mo>{</mo> <munderover> <mi>&Sigma;</mi> <mrow> <mi>m</mi> <mo>=</mo> <mn>0</mn> </mrow> <mi>w</mi> </munderover> <munderover> <mi>&Sigma;</mi> <mrow> <mi>n</mi> <mo>=</mo> <mn>0</mn> </mrow> <mi>h</mi> </munderover> <msup> <mrow> <mo>[</mo> <msub> <mi>I</mi> <mn>2</mn> </msub> <mrow> <mo>(</mo> <msub> <mi>i</mi> <mn>2</mn> </msub> <mo>,</mo> <msub> <mi>j</mi> <mn>2</mn> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mover> <mrow> <msub> <mi>I</mi> <mn>2</mn> </msub> <mrow> <mo>(</mo> <msub> <mi>i</mi> <mn>2</mn> </msub> <mo>,</mo> <msub> <mi>j</mi> <mn>2</mn> </msub> <mo>)</mo> </mrow> </mrow> <mo>&OverBar;</mo> </mover> <mo>]</mo> </mrow> <mn>2</mn> </msup> <mo>}</mo> </msqrt> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>式中,w,k为重叠区的宽高。显然,相似度C取值范围是(‑1,1),取值越大说明重叠区相关程度越高;步骤5‑3、确定前k帧的最优单应性矩阵对连续前k帧重叠区域相似度求极大值,把相关性最高的图像帧的单应性矩阵作为最优的单应性矩阵,并将其作为后继帧的单应性矩阵;步骤6、根据最优的单应性矩阵进行后继视频帧场景的拼接;步骤7、输出拼接后的视频。
地址 100081 北京市海淀区西土城8号