发明名称 基于深度学的镜头边缘检测方法
摘要 本发明公开一种基于深度学的镜头边缘检测方法,首先将视频分段,计算各段的帧内亮度距离的局部阈值,选出镜头边缘候选段,剔除不含镜头边缘的视频段;将镜头边缘候选段两次进行二分处理,根据新分出的两小段的段内亮度距离的关系来选出镜头边缘候选段,剔除不含镜头边缘的视频段;对长度为6帧的镜头边缘候选段,选取该段的关键帧,输入卷积神经网络得到关键帧的标签,进一步确定该段内是否有突变镜头边缘以及其位置;而对于没有突变镜头边缘的镜头边缘候选段,选取该段的关键帧,输入卷积神经网络得到关键帧的标签,根据标签来确定该候选段是否是渐变镜头边缘;将相邻的渐变镜头边缘融合成为一个渐变镜头边缘。
申请公布号 CN104952073A 申请公布日期 2015.09.30
申请号 CN201510332345.1 申请日期 2015.06.15
申请人 上海交通大学 发明人 宋利;童文荆;杨小康
分类号 G06T7/00(2006.01)I 主分类号 G06T7/00(2006.01)I
代理机构 上海汉声知识产权代理有限公司 31236 代理人 徐红银;郭国中
主权项 一种基于深度学习的镜头边缘检测方法,其特征在于所述方法包括如下步骤:第一步,把视频帧分段,段与段之间不重合,每段21帧;第二步,计算各个段的段内亮度距离;第三步,根据第二步计算得到的各段的段内亮度距离计算局部阈值;第四部,根据各个段的段内亮度距离和局部阈值的关系确定该视频段是否为镜头边缘候选段,段内可能包括镜头边界;第五步,将镜头边缘候选段均分成两小段,并根据这两小段的段内亮度距离的关系去确定这两小段内是否可能存在镜头边缘;第六步,把第五步之后得到的长度为11帧的镜头边缘候选段继续均分成两小段,并根据这两小段的段内亮度距离的关系去确定这两小段内是否可能存在镜头边缘;第七步,用ImageNet的数据库训练一个8层的卷积神经网络,输入一个视频帧得到该图片帧在ImageNet的1000类上的概率分布,选取概率前五的类别来作为该视频帧的标签;第八步,对于第六步之后得到的长度为6帧的镜头边缘候选段,选取该段的关键帧,输入第七步中的卷积神经网络得到关键帧的标签,根据标签以及段内相邻帧的亮度距离确定该段内是否有突变镜头边缘,以及突变镜头边缘的位置;第九步,对于第八步之后没有突变镜头边缘的镜头边缘候选段,选取该段的关键帧,输入第七步中的卷积神经网络得到关键帧的标签,根据标签来确定该候选段是否是渐变镜头边缘;第十步,对于第九步之后得到的渐变镜头边缘,将相邻的融合起来。
地址 200240 上海市闵行区东川路800号