一种视频字幕文本提取和识别的方法,申请号CN201110315054.3-传众专利搜索

发明名称	一种视频字幕文本提取和识别的方法
摘要	本发明公开了一种视频字幕文本提取和识别的方法，其步骤包括：输入视频中字幕区域的图像；将输入图像转化为灰度图；判断字幕区域中字符排列的方向；将竖直排列的字幕区域逆时针旋转90°得到水平字幕区域；对字幕区域进行分行得到单行字幕图像；对单行字幕区域图像自动判断前景颜色，得到单行字幕二值图像；对单行字幕二值图像进行过切分得到字符片段序列；对过切分后的单行字幕二值图像进行文本行识别。本方法能有效分割水平和竖直的视频字幕文本行，准确判断字符前景颜色并滤除噪声，并得到准确的字符切分与识别结果，可以适用于视频和图像内容编辑、索引与检索等多种用途。
申请公布号	CN102332096A	申请公布日期	2012.01.25
申请号	CN201110315054.3	申请日期	2011.10.17
申请人	中国科学院自动化研究所	发明人	刘成林;白博;殷飞
分类号	G06K9/20(2006.01)I;G06K9/32(2006.01)I;G06K9/46(2006.01)I	主分类号	G06K9/20(2006.01)I
代理机构	中科专利商标代理有限责任公司 11021	代理人	周国城
主权项	一种视频字幕文本提取和识别的方法，其特征在于，该方法包括：步骤S1：输入视频中字幕区域的图像；步骤S2：将输入图像转化为灰度图；步骤S3：判断字幕区域中字符排列的方向；步骤S4：如果字幕区域中字符排列的方向为竖直排列，则将竖直排列的字幕区域逆时针旋转90°得到水平字幕区域；步骤S5：对字幕区域进行分行得到单行字幕图像；步骤S6：对单行字幕图像自动判断前景颜色，并得到真实的单行字幕二值图像；步骤S7：对单行字幕二值图像进行过切分得到字符片段序列；步骤S8：对过切分后的单行字幕二值图像进行文本行识别。
地址	100190 中国北京市海淀区中关村东路95号

您可能感兴趣的专利