发明名称 一种视频字幕文本提取和识别的方法
摘要 本发明公开了一种视频字幕文本提取和识别的方法,其步骤包括:输入视频中字幕区域的图像;将输入图像转化为灰度图;判断字幕区域中字符排列的方向;将竖直排列的字幕区域逆时针旋转90°得到水平字幕区域;对字幕区域进行分行得到单行字幕图像;对单行字幕区域图像自动判断前景颜色,得到单行字幕二值图像;对单行字幕二值图像进行过切分得到字符片段序列;对过切分后的单行字幕二值图像进行文本行识别。本方法能有效分割水平和竖直的视频字幕文本行,准确判断字符前景颜色并滤除噪声,并得到准确的字符切分与识别结果,可以适用于视频和图像内容编辑、索引与检索等多种用途。
申请公布号 CN102332096A 申请公布日期 2012.01.25
申请号 CN201110315054.3 申请日期 2011.10.17
申请人 中国科学院自动化研究所 发明人 刘成林;白博;殷飞
分类号 G06K9/20(2006.01)I;G06K9/32(2006.01)I;G06K9/46(2006.01)I 主分类号 G06K9/20(2006.01)I
代理机构 中科专利商标代理有限责任公司 11021 代理人 周国城
主权项 一种视频字幕文本提取和识别的方法,其特征在于,该方法包括:步骤S1:输入视频中字幕区域的图像;步骤S2:将输入图像转化为灰度图;步骤S3:判断字幕区域中字符排列的方向;步骤S4:如果字幕区域中字符排列的方向为竖直排列,则将竖直排列的字幕区域逆时针旋转90°得到水平字幕区域;步骤S5:对字幕区域进行分行得到单行字幕图像;步骤S6:对单行字幕图像自动判断前景颜色,并得到真实的单行字幕二值图像;步骤S7:对单行字幕二值图像进行过切分得到字符片段序列;步骤S8:对过切分后的单行字幕二值图像进行文本行识别。
地址 100190 中国北京市海淀区中关村东路95号