发明名称 一种快速准确的视频字幕提取方法
摘要 本发明公开一种快速准确的视频字幕提取方法,本发明的流程为:抽取视频关键帧亮度图像,纹理投影定位字幕条,确定字幕条起始帧和终止帧,以及提取文字。通过小波变换提取视频关键帧亮度图像的纹理图,利用纹理图投影方法来定位关键帧图像中字幕条的位置;利用字幕点匹配方法来判断两帧是否存在同一条字幕,并快速地确定字幕条在视频中的起始帧和终止帧,这样只调用一次定位,便可以确定字幕条的所有持续帧,用来提高字幕提取速度;用纹理去噪方法提取字幕条中的文字。
申请公布号 CN101448100A 申请公布日期 2009.06.03
申请号 CN200810236503.3 申请日期 2008.12.26
申请人 西安交通大学 发明人 刘贵忠;李智;钱学明;姜龙
分类号 H04N5/278(2006.01)I;G06K9/32(2006.01)I 主分类号 H04N5/278(2006.01)I
代理机构 西安通大专利代理有限责任公司 代理人 陈翠兰
主权项 1、一种快速准确的视频字幕提取方法,其特征在于,包括以下步骤:首先,抽取视频中关键帧的亮度图像;接着,对当前关键帧的亮度图像来定位字幕条位置:首先采样关键帧的亮度图像,生成纹理图;接着确定水平字幕条的位置:先进行垂直纹理图水平投影求差分,然后确定水平字幕条上下边框,再确定水平字幕条左右边框;接着确定垂直字幕条的位置:先进行水平纹理图垂直投影求差分,然后确定垂直字幕条左右边框,再确定垂直字幕条上下边框;最后进行字幕条去噪,确定字幕条位置;然后,确定字幕条起始帧和终止帧:首先,判断当前关键帧是否有字幕:如果没有字幕,则继续进行下一个关键帧的字幕条定位,直到有字幕条出现;如果出现字幕条,设当前关键帧为字幕条关键帧,则在前一个关键帧和字幕条关键帧之间确定字幕条的起始帧,然后用字幕条关键帧的字幕条区域依次匹配后面的关键帧,如果匹配一致,将继续匹配,直到匹配不一致,则在前一个关键帧和当前关键帧确定字幕条的终止帧;最后,利用纹理去噪方法提取视频中的文字信息:首先,求存在同一条字幕的多帧视频帧亮度图像的字幕条区域的平均和图像;接着,将平均和图像进行OTSU分割,生成只有黑白两种颜色连通域的字幕区域图像;然后,对OTSU分割后的图像确定哪种颜色为文字区域;最后,剔除非文字噪声。
地址 710049陕西省西安市咸宁路28号