一种视频中文字的检测与提取方法,申请号CN201310689506.3-传众专利搜索

发明名称	一种视频中文字的检测与提取方法
摘要	一种视频中文字的检测与提取方法，包括：启动算法，将彩色图像转换为灰度图像；对其进行降采样处理；分别获取图像I（x，y）的小波综合图像和角点特征图像；分别从角点特征图像和小波综合图像提取7个统计特征，产生14维的特征向量并归一化；将特征向量放入k-means分类器中作分类；对角点特征图像进行二值化处理，再作形态学处理；根据二值图像的饱和度和方向两个特征作候选文字区域的筛选，对筛选后获得的文字区域做一次掩膜不超过N/2的膨胀；进行文字提取。本发明结合小波变换高频综合图像和角点特征图像，提取统计特征获取文字区域，并运用彩色空间和非监督分类器来提取文字像素。有较好的检测率和缺失率，无需训练样本，算法的复杂度相对较低。
申请公布号	CN103699895A	申请公布日期	2014.04.02
申请号	CN201310689506.3	申请日期	2013.12.12
申请人	天津大学	发明人	褚晶辉;吕卫;董越
分类号	G06K9/20(2006.01)I;G06K9/46(2006.01)I	主分类号	G06K9/20(2006.01)I
代理机构	天津市北洋有限责任专利代理事务所 12201	代理人	杜文茹
主权项	一种视频中文字的检测与提取方法，其特征在于，首先进行文字检测，然后进行文字提取，具体包括如下步骤：1）启动算法，将彩色图像转换为灰度图像；2）对灰度图像进行降采样处理，设定图像宽度的阈值为t1,当图像的宽度＞t1时，作降采样处理，当图像的宽度t1≤时，不作任何处理，获取的图像设为I（x，y）；3）分别获取步骤2）中得到的图像I（x，y）的小波综合图像和角点特征图像；4）结合角点特征图像和小波综合图像的统计特征来作为区分文字和非文字区域的特性，分别从角点特征图像和小波综合图像提取7个统计特征，产生14维的特征向量并归一化；5）将特征向量放入k‑means分类器中作分类，设定k=2，分类后将连通的文字块区域的外接矩形作为候选的文字区域；6）对步骤3）中的角点特征图像进行二值化处理，再对处理后的二值化图像作形态学处理；7）根据形态学处理后的二值图像的饱和度和方向两个特征作候选文字区域的筛选，对筛选后获得的文字区域做一次掩膜不超过N/2的膨胀；8）进行文字提取，包括：（1）根据步骤7）获取的文字位置信息，获取彩色文字条；（2）在RGB彩色空间中对子通道图像分别运用大津法获得阈值作二值化处理，再合并三个二值图像，仅保留文字像素的交集，即候选文字像素区域；（3）只将候选的文字像素区域的灰度值放入k‑means分类器中做分类，区分标记后获取最终的文字像素区域。
地址	300072 天津市南开区卫津路92号