主权项 |
一种基于深度学习的镜头边缘检测方法,其特征在于所述方法包括如下步骤:第一步,把视频帧分段,段与段之间不重合,每段21帧;第二步,计算各个段的段内亮度距离;第三步,根据第二步计算得到的各段的段内亮度距离计算局部阈值;第四部,根据各个段的段内亮度距离和局部阈值的关系确定该视频段是否为镜头边缘候选段,段内可能包括镜头边界;第五步,将镜头边缘候选段均分成两小段,并根据这两小段的段内亮度距离的关系去确定这两小段内是否可能存在镜头边缘;第六步,把第五步之后得到的长度为11帧的镜头边缘候选段继续均分成两小段,并根据这两小段的段内亮度距离的关系去确定这两小段内是否可能存在镜头边缘;第七步,用ImageNet的数据库训练一个8层的卷积神经网络,输入一个视频帧得到该图片帧在ImageNet的1000类上的概率分布,选取概率前五的类别来作为该视频帧的标签;第八步,对于第六步之后得到的长度为6帧的镜头边缘候选段,选取该段的关键帧,输入第七步中的卷积神经网络得到关键帧的标签,根据标签以及段内相邻帧的亮度距离确定该段内是否有突变镜头边缘,以及突变镜头边缘的位置;第九步,对于第八步之后没有突变镜头边缘的镜头边缘候选段,选取该段的关键帧,输入第七步中的卷积神经网络得到关键帧的标签,根据标签来确定该候选段是否是渐变镜头边缘;第十步,对于第九步之后得到的渐变镜头边缘,将相邻的融合起来。 |