发明名称 一种基于统计的视频主持人识别方法
摘要 本发明公开了一种基于统计的视频主持人识别方法,对视频图像进行解码、分组和灰度处理,定位出每个灰度图像中的人脸位置和该人脸人物所穿衣服的衣服位置;通过直方图特征对每组图像的人脸位置区域图像进行相关性分析,计算相邻两组图像的人脸位置区域图像的相关度,将相似的两组图像连接形成片段;从每个片段中选取关键帧;根据关键帧的特征,对所有选取出来的关键帧进行相似度分析;将相似的关键帧归为一类,得到多个类别的关键帧,并统计每个类别中关键帧的数目;根据视频主持人的特征,将符合视频主持人的特征的类别,判定为存在视频主持人的关键帧,并确定出视频主持人在该类别的关键帧中的位置。本发明便于对新闻视频进行拆条处理。
申请公布号 CN105718871A 申请公布日期 2016.06.29
申请号 CN201610030286.7 申请日期 2016.01.18
申请人 成都索贝数码科技股份有限公司 发明人 谢超平;吴春中;陈晓军
分类号 G06K9/00(2006.01)I 主分类号 G06K9/00(2006.01)I
代理机构 成都金英专利代理事务所(普通合伙) 51218 代理人 袁英
主权项 一种基于统计的视频主持人识别方法,其特征在于,所述方法包括以下步骤:S1,视频预处理:S101,以帧为单位对视频图像进行解码处理,输出视频帧数据;S102,对视频帧数据进行分组处理,每m帧为一组得到多组三通道图像;S103,通过RGB三通道将每组三通道图像均转化为单通道灰度图像;S2,人脸识别处理:对每组三通道图像的灰度图像进行人脸识别,定位出每个灰度图像中的人脸位置;S3,衣服识别处理:根据人脸位置对人物的衣服进行识别,定位出该人脸人物所穿衣服的衣服位置;S4,相关性分析:S401,通过直方图特征对每组三通道图像的人脸位置区域图像进行相关性分析,对相邻两组三通道图像的人脸位置区域图像提取直方图,并进行均衡化处理;S402,计算该相邻两组三通道图像的人脸位置区域图像的相关度,判断该两组三通道图像是否相似,并将相似的两组三通道图像连接形成片段;S5,选取关键帧:S501:在每个片段中选取一个或多个帧作为关键帧;S502,根据关键帧的特征,对所有选取出来的关键帧进行相似度分析;S503,将相似的关键帧归为一类,得到多个类别的关键帧,并统计每个类别中关键帧的数目;S6,定位视频支持人:根据视频主持人的特征,将符合视频主持人的特征的类别,判定为存在视频主持人的关键帧,并确定出视频主持人在该类别的关键帧中的位置。
地址 610041 四川省成都市高新区新加坡工业园新元大道南二路2号