发明名称 一种新闻视频条目拆分的方法和系统
摘要 本发明提出了一种新闻视频条目拆分方法和系统。该方法为:从广播电视信号中,解码出音频信号,对音频信号提取音频指纹特征,与新闻节目模板库中的模板进行匹配,确定新闻节目在广播电视信号中的播出时间,根据播出时间得到新闻节目视频,借助人机交互界面,利用人工操作和计算机智能音视频算法结合的方法,将新闻节目视频拆分为独立的新闻条目。本发明能够保证实现对新闻节目的拆分。
申请公布号 CN103533459B 申请公布日期 2017.05.03
申请号 CN201310468354.4 申请日期 2013.10.09
申请人 北京中科模识科技有限公司 发明人 姜洪臣
分类号 H04N21/845(2011.01)I;H04N21/472(2011.01)I 主分类号 H04N21/845(2011.01)I
代理机构 北京路浩知识产权代理有限公司 11002 代理人 李相雨
主权项 一种新闻视频条目拆分方法,其特征在于,预先设置新闻节目模板库,该方法还包括:步骤1:从广播电视信号中,解码出音频信号,对音频信号提取音频指纹特征;步骤2:把从广播电视信号中提取出的音频指纹特征与新闻节目模板库中的模板进行匹配,确定新闻节目在广播电视信号中的播出时间,根据播出时间,得到新闻节目视频;步骤3:对于得到的新闻节目视频,借助人机交互界面,利用人工操作和计算机智能音视频算法结合的方法,将新闻节目视频拆分为独立的新闻条目;其中,所述借助人机交互界面,利用人工操作和计算机智能音视频算法结合的方法,将得到的新闻节目视频拆分为独立的新闻条目包括:步骤301:通过人机交互界面,用户浏览新闻视频决定拆分点的候选区域,计算机保存候选区域图像信息;步骤302:计算机智能音视频算法对候选区域图像进行分析处理,向用户提供条目拆分点的候选位置;步骤303:用户判定计算机智能音视频算法处理的结果是否正确,若正确,用户标记拆分点,存入数据库;否则,返回步骤301~303;其中,所述计算机智能音视频算法包括:步骤311:计算候选区域内显示框中视频帧两侧的图像场景差异度V;步骤312:计算候选区域内显示框中的视频帧两侧的音频差异度A;步骤313:将所述的视频帧两侧的图像场景差异度V和音频差异度A融合并转化为该视频帧作为新闻条目拆分点的概率P:P=e<sup>‑δ(V+kA)</sup>其中,k为调整视频差异度和音频差异度的权重,δ为差异度转化为概率的平滑参数;步骤314:选取概率值P最大的视频帧,作为新闻条目拆分点的候选位置,并将其所在的显示框以特定颜色做标记向用户展示处理结果;所述步骤311包括:用HSV空间颜色直方图计算图像场景差异度V,具体为:在视频帧两侧各1秒的区间内等间隔采样三帧图片,表示为[f<sub>‑3</sub>,f<sub>‑2</sub>,f<sub>‑1</sub>,f<sub>1</sub>,f<sub>2</sub>,f<sub>3</sub>],然后计算对应视频帧之间的HSV空间颜色直方图的差,并融合得到最终的图像场景差异度V:V=(|f<sub>‑1</sub>‑f<sub>1</sub>|+|f<sub>‑2</sub>‑f<sub>2</sub>|+|f<sub>‑3</sub>‑f<sub>3</sub>|)/3;其中,所述预先设置新闻节目模板库包括:人工搜集需要做拆分的新闻节目的片花,将搜集的节目片花解码出音频信号,提取音频指纹特征并作为模板存入新闻模板库中;所述把从广播电视信号中提取出的音频指纹特征与新闻节目模板库中的模板进行匹配包括:将从广播电视信号中提取出的音频指纹特征分段,把每个分段的音频指纹特征和新闻节目模板库中的模板进行逐帧匹配,当匹配相似度大于设定阈值时,则该分段与模板库中的节目模板匹配成功,当连续匹配成功设定个数的分段后,则确定与新闻节目模板库中的模板匹配成功。
地址 100190 北京市海淀区中关村东路95号自动化大厦5层