发明名称 生成视频摘要的方法及装置
摘要 本发明公开了生成视频摘要的方法及装置,一种方法包括:接收视频文件;对所述视频文件的视觉精彩度进行处理;对所述视频文件的声音精彩度进行处理;将满足视觉精彩度和声音精彩度的关联镜头组聚合成视频片断。背景技术中,对足球比赛视频文档根据音频特征、视觉特征、文本特征和运动特征等四种特征进行处理,得到足球视频摘要,采用本发明实施例生成视频摘要的方法及装置,对视频文件的视觉精彩度和/或声音精彩度进行处理,减少特征种类,降低计算复杂度,提高视频摘要生成的效率和准确率。
申请公布号 CN101431689B 申请公布日期 2012.01.04
申请号 CN200710165165.4 申请日期 2007.11.05
申请人 华为技术有限公司;华中科技大学 发明人 于俊清;何云峰;牛彩卿
分类号 H04N9/82(2006.01)I;G11B27/034(2006.01)I 主分类号 H04N9/82(2006.01)I
代理机构 北京集佳知识产权代理有限公司 11227 代理人 梁明升;逯长明
主权项 一种生成视频摘要的方法,其特征在于,该方法包括:接收视频文件;对所述视频文件的视觉精彩度进行处理,包括:将所述视频文件进行镜头边界检测,得到镜头集;对所述镜头集进行镜头分类;对已经分类的镜头集进行聚合,得到关联镜头组;计算各关联镜头组所包含镜头的权值之和,作为各关联镜头组视觉精彩度,将视觉精彩度与不同阈值比较,当视觉精彩度在相应的阈值范围时,达到相应的精彩度级别,其中,对应不同的精彩度级别,阈值设置不同;将满足视觉精彩度的关联镜头组聚合成视频片断,具体包括:利用符合视觉精彩度关联镜头组中的任意一个关键帧定位其所在的关联镜头组,找出符合视觉精彩度的关联镜头组;将满足视觉精彩度的关联镜头组聚合成一个视频片断;得到的视频片断组成视频摘要;其中,所述对所述镜头集进行镜头分类具体包括:提取所述镜头集中代表镜头类型的关键帧和将所述关键帧分类;所述将所述关键帧分类具体包括:将所述关键帧由红、绿和蓝RGB三基色空间转换到色调、饱和度和亮度HSV空间;将每个视频帧分成若干区域;根据所述各区域的主色覆盖率将所述各区域划分为不同类别;为不同类别的区域分配不同的权值;根据区域的权值将关键帧划分为以下类别:长镜头、半镜头、3/4镜头、球门镜头、特写镜头、中镜头、短镜头和其他镜头;所述对已经分类的镜头集进行聚合,得到关联镜头组具体包括:根据被标识为长镜头的关键帧,查找对应的长镜头;生成以长镜头为开始镜头,下一个长镜头的前一个镜头为结束镜头的关联镜头组;其中所述视频文件为足球视频文件。
地址 518129 广东省深圳市龙岗区坂田华为总部办公楼