发明名称 一种快速检测在线视频流中静态叠加文字的方法及系统
摘要 本发明涉及一种图像和视频处理方法及系统,特别是关于一种快速检测在线视频流中静态叠加文字的方法及系统。静态叠加文字检测方法利用帧间相关信息及小波域建模等方法,可以有效的去除运动文字和背景区域,并保留静态叠加文字区域。本方法可以实现对在线视频流中静态叠加文字位置的快速检测。同时,基于静态叠加文字检测方法构建了一种在线视频流检索系统。本系统中,在各个用户终端上使用不同的参数族进行快速的文字检测,并将结果通过OCR控件转化为文本流。在各用户终端将文本流传输至集中检索服务器进行整合后,可以提供对各频道的多时间粒度的检索功能,并提供对各频道的基于内容的快速浏览功能。本发明可以在不侵犯版权的情况下,实现对多路多种质量的在线视频流进行同步分析、索引、检索以及浏览的功能,并且不需要对各种视频流建立专门的服务器。
申请公布号 CN101137017A 申请公布日期 2008.03.05
申请号 CN200710176126.4 申请日期 2007.10.19
申请人 北京大学 发明人 李甲;田永鸿;黄铁军;高文
分类号 H04N5/278(2006.01);G06F17/30(2006.01) 主分类号 H04N5/278(2006.01)
代理机构 北京纪凯知识产权代理有限公司 代理人 徐宁;关畅
主权项 1.一种快速检测在线视频流中静态叠加文字的方法,包括下列步骤:1)在小波域上定义帧间相关信息用于描述边缘的稳定性,并去除运动背景区域和非静态叠加文字区域;2)使用泛化高斯模型对小波子带的系数分布进行建模,以模拟小波系数的分布情况并推导出相应的阈值,以用于提取强边缘区域;3)对经由上述两步剩余的区域,使用形态学的相关操作,分割成候选文字行;4)对候选文字行,使用步骤1)中所计算出的帧间相关信息进行帧间跟踪,以去除不是本帧首次出现的候选文字行;5)对剩余的候选文字行,在小波域提取相应的特征,并使用支持向量机做为分类器,以获取真实的文字行,即为本帧新出现的静态叠加文字。
地址 100871北京市海淀区颐和园路5号北京大学数字媒体研究所