发明名称 |
一种视频字幕的提取方法及装置 |
摘要 |
本发明实施例公开了一种视频字幕的提取方法及装置,属于图像处理领域。方法包括:将各图像帧进行叠加平均,则得到边缘强度图;在各边缘强度图中逐点扫描,统计边缘强度图中的笔画强度,并基于笔画强度将图像帧进行二值化;分析二值图中的连通域定位出对应的文字区域;在文字区域中拟合各颜色通道进行颜色聚类后滤波,从而在文字区域中提取对应的文字,进行OCR识别后得到视频中的字幕。本发明通过从图像增强后的各图像帧中定位文字区域,并以颜色聚类的方式提取文字区域中的文字后识别,通过颜色聚类在文字区域中有效地对视频帧中的文字进行了提取,不受文字区域中复杂背景的影响,从而提高了字幕的识别效果。 |
申请公布号 |
CN102915438A |
申请公布日期 |
2013.02.06 |
申请号 |
CN201210297750.0 |
申请日期 |
2012.08.21 |
申请人 |
北京捷成世纪科技股份有限公司 |
发明人 |
徐洪伟;苏鹏宇 |
分类号 |
G06K9/20(2006.01)I;G06K9/54(2006.01)I |
主分类号 |
G06K9/20(2006.01)I |
代理机构 |
|
代理人 |
|
主权项 |
一种视频字幕的提取方法,其特征在于,包括如下步骤:抽取视频中的图像帧,将各图像帧进行叠加平均,则得到边缘强度图;在各边缘强度图中逐点扫描,统计边缘强度图中的笔画强度,并基于笔画强度将图像帧进行二值化;分析所述二值图中的连通域,从图像帧中定位出对应的文字区域;在文字区域中拟合各颜色通道进行颜色聚类后滤波,从而按得到的类别在含有字幕的文字区域中提取对应的文字;将所述文字进行OCR识别,得到视频中的字幕。 |
地址 |
100191 北京市海淀区知春路1号学院国际大厦7层 |