发明名称 一种视频字幕的提取方法及装置
摘要 本发明实施例公开了一种视频字幕的提取方法及装置,属于图像处理领域。方法包括:将各图像帧进行叠加平均,则得到边缘强度图;在各边缘强度图中逐点扫描,统计边缘强度图中的笔画强度,并基于笔画强度将图像帧进行二值化;分析二值图中的连通域定位出对应的文字区域;在文字区域中拟合各颜色通道进行颜色聚类后滤波,从而在文字区域中提取对应的文字,进行OCR识别后得到视频中的字幕。本发明通过从图像增强后的各图像帧中定位文字区域,并以颜色聚类的方式提取文字区域中的文字后识别,通过颜色聚类在文字区域中有效地对视频帧中的文字进行了提取,不受文字区域中复杂背景的影响,从而提高了字幕的识别效果。
申请公布号 CN102915438A 申请公布日期 2013.02.06
申请号 CN201210297750.0 申请日期 2012.08.21
申请人 北京捷成世纪科技股份有限公司 发明人 徐洪伟;苏鹏宇
分类号 G06K9/20(2006.01)I;G06K9/54(2006.01)I 主分类号 G06K9/20(2006.01)I
代理机构 代理人
主权项 一种视频字幕的提取方法,其特征在于,包括如下步骤:抽取视频中的图像帧,将各图像帧进行叠加平均,则得到边缘强度图;在各边缘强度图中逐点扫描,统计边缘强度图中的笔画强度,并基于笔画强度将图像帧进行二值化;分析所述二值图中的连通域,从图像帧中定位出对应的文字区域;在文字区域中拟合各颜色通道进行颜色聚类后滤波,从而按得到的类别在含有字幕的文字区域中提取对应的文字;将所述文字进行OCR识别,得到视频中的字幕。
地址 100191 北京市海淀区知春路1号学院国际大厦7层