发明名称 一种在视频画面中提取字幕区域的方法
摘要 本发明公开了一种在视频画面中提取字幕区域的方法,它包括以下步骤:S1:去除噪音处理:根据字幕和背景画面的纹理差异采用最大值梯度方法得到梯度图像数据:其中,字幕部分会有整齐的数据,而背景画面则会出现无规律的噪音数据;去除无规律的噪音数据部分;S2:采用加锁腐蚀的方式定位字幕区域;S3:确定新闻标题。本发明是为了提高新闻拆条处理的效率,快速给拆分的新闻确定合适的标题,同时为了方便对新闻视频的分类整理、快速搜索而提供的一种依据视频字幕特性从视频画面中提取字幕区域的方法。其中,采用加锁腐蚀的方法确定字幕区域方便并且可靠性高。
申请公布号 CN106162330A 申请公布日期 2016.11.23
申请号 CN201610597947.4 申请日期 2016.07.27
申请人 成都索贝数码科技股份有限公司 发明人 谢超平;吴春中;罗明利
分类号 H04N21/44(2011.01)I;H04N21/435(2011.01)I;H04N21/488(2011.01)I;H04N5/278(2006.01)I 主分类号 H04N21/44(2011.01)I
代理机构 成都金英专利代理事务所(普通合伙) 51218 代理人 袁英
主权项 一种在视频画面中提取字幕区域的方法,其特征在于:它包括以下步骤:S1:去除噪音处理:根据字幕和背景画面的纹理差异采用最大值梯度方法得到梯度图像数据:其中,字幕部分会有整齐的数据,而背景画面则会出现无规律的噪音数据;去除无规律的噪音数据部分;S2:定位字幕区域,包括以下子步骤:S21:布种子,初始状态下,把整个区域的值设置为背景,根据梯度图像数据寻找合适的地方布下种子,以保证种子在字上;S22:采用最大值法计算待判断腐蚀的点即G点的值,包括以下子步骤:S221:分别计算出原始图在垂直、水平、对角线三个方向的灰度、R、G、B四个通道的最大值;S222:计算四个值中的最大值,所述最大值记为G点的值;S23:加锁腐蚀,包括以下子步骤:S231:依次遍历种子图中种子的左、右、上、下四个方向的点,判断该点是否被腐蚀即判断该点是否为G点:如果该点已经被腐蚀,继续判断下一个点;若该点未被腐蚀,则继续下一步;S232:比较该点的值和一个设定的第一阈值nGsensitive的大小,若该点的值大于阈值则不能腐蚀该点,即为该点加了一层锁;若该点的值小于阈值,则进行下一步,进行向左腐蚀;S233: G点为种子左边待判断腐蚀的点,种子右边有0到N个已经被腐蚀的点,向左腐蚀,包括以下子步骤:S2331:判断种子右边的被腐蚀的点的数量:(1)当种子右边没有被腐蚀的点时,则G点可以被腐蚀;(2)当种子右边有1到N 个被腐蚀的点时,计算G点与最右边的点的灰度、R、G、B四通道的最大值,当该最大值小于设定的第二阈值nSensitive,则G点可以腐蚀,否则不能被腐蚀即给该点加一层锁;S2332:被腐蚀的点成为种子,并返回步骤S2331直到无法再腐蚀位置;S234:监测字幕边缘区域是否达到腐蚀标准,如果已达到则结束腐蚀,否则加大腐蚀的第二阈值nSensitive再重复上述步骤;S235:根据腐蚀结果提取字幕数据,然后再根据文字特征去除噪音数据,最后得到一个准确的字幕位置区域;S3:确定新闻标题,包括以下子步骤:S31:依据视频特性中字幕的连续性特征对视频中连续的相同字幕区域进行筛选和过滤,并选取效果较好的作为识别字幕的图片;S32:将字幕图片转换为文字,即为这则新闻的新闻标题。
地址 610041 四川省成都市高新区新园南二路2号