发明名称 |
一种视频字幕文本提取和识别的方法 |
摘要 |
本发明公开了一种视频字幕文本提取和识别的方法,其步骤包括:输入视频中字幕区域的图像;将输入图像转化为灰度图;判断字幕区域中字符排列的方向;将竖直排列的字幕区域逆时针旋转90°得到水平字幕区域;对字幕区域进行分行得到单行字幕图像;对单行字幕区域图像自动判断前景颜色,得到单行字幕二值图像;对单行字幕二值图像进行过切分得到字符片段序列;对过切分后的单行字幕二值图像进行文本行识别。本方法能有效分割水平和竖直的视频字幕文本行,准确判断字符前景颜色并滤除噪声,并得到准确的字符切分与识别结果,可以适用于视频和图像内容编辑、索引与检索等多种用途。 |
申请公布号 |
CN102332096A |
申请公布日期 |
2012.01.25 |
申请号 |
CN201110315054.3 |
申请日期 |
2011.10.17 |
申请人 |
中国科学院自动化研究所 |
发明人 |
刘成林;白博;殷飞 |
分类号 |
G06K9/20(2006.01)I;G06K9/32(2006.01)I;G06K9/46(2006.01)I |
主分类号 |
G06K9/20(2006.01)I |
代理机构 |
中科专利商标代理有限责任公司 11021 |
代理人 |
周国城 |
主权项 |
一种视频字幕文本提取和识别的方法,其特征在于,该方法包括:步骤S1:输入视频中字幕区域的图像;步骤S2:将输入图像转化为灰度图;步骤S3:判断字幕区域中字符排列的方向;步骤S4:如果字幕区域中字符排列的方向为竖直排列,则将竖直排列的字幕区域逆时针旋转90°得到水平字幕区域;步骤S5:对字幕区域进行分行得到单行字幕图像;步骤S6:对单行字幕图像自动判断前景颜色,并得到真实的单行字幕二值图像;步骤S7:对单行字幕二值图像进行过切分得到字符片段序列;步骤S8:对过切分后的单行字幕二值图像进行文本行识别。 |
地址 |
100190 中国北京市海淀区中关村东路95号 |