发明名称 一种基于深度学技术的视频摘要生成方法
摘要 一种基于深度学技术的视频摘要生成方法,包括:对视频流逐帧进行背景建模,获取运动前景作为候选运动目标;使用多目标跟踪算法对每一帧的候选运动目标跟踪,更新形成运动轨迹的候选目标;使用卷积神经网络训练目标分类器,对候选目标进行确认,在确认真实运动目标后,使用分类器对目标类别进行判定;将所有真实运动目标和相关信息贴合在少量图像上,形成视频快照显示给用户。本发明利用深度学技术对真实目标和噪声进行准确区分;且利用准确的多目标追踪技术来避免逐帧进行目标确认,大幅减少了计算量,有效降低了弱小目标的漏检率及噪声的虚警率,提升了视频处理速度,能够运用于各种复杂的场景。
申请公布号 CN104244113A 申请公布日期 2014.12.24
申请号 CN201410525704.0 申请日期 2014.10.08
申请人 中国科学院自动化研究所 发明人 袁飞;唐矗
分类号 H04N21/8549(2011.01)I;G06T7/20(2006.01)I 主分类号 H04N21/8549(2011.01)I
代理机构 中科专利商标代理有限责任公司 11021 代理人 宋焰琴
主权项 一种基于深度学习技术的视频摘要生成方法,包括以下步骤:步骤1,对输入的原始视频的图像序列进行背景建模,提取运动目标对应的前景区域;步骤2,将获得的所述前景区域作为运动候选目标,使用多目标跟踪技术对所述运动候选目标进行跟踪,计算每一帧中所述运动候选目标的运动轨迹;步骤3,对确定所述运动轨迹为活跃轨迹的运动候选目标使用基于深度学习技术的目标分类器进行进一步确认,判定所述运动候选目标是否是真实的目标,以及确认目标后,再使用分类器判断所述运动候选目标的类别;步骤4,将多个检测到的所述运动目标贴合在同一幅图像中,生成视频快照,以所述视频快照展示视频中检测到的所述运动目标。
地址 100190 北京市海淀区中关村东路95号