发明名称 视频文本处理装置
摘要 通过从给定的视频帧中去除多余的帧和非文本帧,选择包含文本区域的视频帧,通过去除伪笔划确定所选择的帧中的文本区域,提取文本区域中的文本行并进行二值化。
申请公布号 CN100458833C 申请公布日期 2009.02.04
申请号 CN200310110287.5 申请日期 2003.12.26
申请人 富士通株式会社 发明人 孙俊;胜山裕;直井聪
分类号 G06K9/20(2006.01);G06K9/32(2006.01) 主分类号 G06K9/20(2006.01)
代理机构 北京三友知识产权代理有限公司 代理人 李辉
主权项 1.一种从给定的视频帧中选择多个包含文本内容的视频帧的文本变化帧检测装置,所述文本变化帧检测装置包括:第一帧去除单元,用于从所述给定的视频帧中去除多余的视频帧;第二帧去除单元,用于从经所述第一帧去除单元去除后而剩余的视频帧中去除不包含文本区域的视频帧;第三帧去除单元,用于从经所述第二帧去除单元去除后而剩余的视频帧中检测并去除由图像移动导致的多余的视频帧;以及输出单元,用于输出其余的视频帧作为候选文本变化帧;其中,所述第一帧去除单元包括:图像块确认单元,用于确定处在所述给定的视频帧中的两个视频帧的相同位置上的两个图像块是否是能够显示图像内容变化的有效块对;图像块相似度测量单元,用于计算有效块对的两个图像块的相似度,并确定所述两个图像块是否相似;以及帧相似度判断单元,用于利用相似图像块的数目与有效块对总数的比率,来确定所述两个视频帧是否相似,并且,所述第一帧去除单元将相似的视频帧作为多余的视频帧去除,并且其中,所述第二帧去除单元包括:快速简易图像二值化单元,用于生成经所述第一帧去除单元去除后而剩余的视频帧的第一二值化图像;文本行区域确定单元,用于利用第一二值化图像的水平投影和垂直投影确定文本行区域的位置;重新二值化单元,用于生成每个文本行区域的第二二值化图像;文本行确认单元,用于利用第一二值化图像和第二二值化图像之间的差异和文本行区域中前景像素数相对于文本行区域中像素总数的填充率,来确定文本行区域的有效性;以及文本帧验证单元,用于利用一组连续视频帧中有效文本行区域的数目,来确认这组连续视频帧是否是不包含文本区域的非文本帧,并且其中,所述第三帧去除单元包括:快速简易图像二值化单元,用于生成经所述第二帧去除单元去除后而剩余的视频帧中的两个视频帧的二值化图像;文本行垂直位置确定单元,用于利用所述两个视频帧的二值化图像的水平投影,确定每个文本行区域的垂直位置;垂直移动检测单元,用于利用水平投影之间的相关性,确定所述两个视频帧之间图像移动的垂直偏移,以及所述两个视频帧在垂直方向的相似度;以及水平移动检测单元,用于利用在所述两个视频帧的二值化图像中每个文本行的垂直投影之间的相关性,确定图像移动的水平偏移以及所述两个视频帧在水平方向的相似度,并且,所述第三帧去除单元把相似的视频帧作为由图像移动导致的多余视频帧而去除。
地址 日本神奈川县川崎市