发明名称 一种图像文字检测方法
摘要 本发明涉及一种图像文字检测方法,基于全新步骤流程设计,适用面更广,并且检出率更高,不再受限于扫描件白底黑字或者黑底白字标准字体检测,可以在不同场景复杂的环境中,如照片,游行横幅,手写文字等各种场景下,将图片上的文字检测出来,且具有更高的工作效率。
申请公布号 CN104200209A 申请公布日期 2014.12.10
申请号 CN201410439223.8 申请日期 2014.08.29
申请人 南京烽火星空通信发展有限公司 发明人 王康;李峰岳
分类号 G06K9/20(2006.01)I;G06K9/54(2006.01)I;G06K9/62(2006.01)I 主分类号 G06K9/20(2006.01)I
代理机构 南京经纬专利商标代理有限公司 32200 代理人 杨海军
主权项 一种图像文字检测方法,用于检测获取图片中的文字,其特征在于,包括如下步骤:步骤A. 将待检测图像按预设比例放大,再对待检测图像进行灰度处理,然后对经灰度处理后的待检测图像进行锐化处理;步骤B. 采用边缘提取算法提取待检测图像上的图像边缘特征,并获得图像边缘二值化图;步骤C. 针对图像边缘二值化图,采用基于边缘的区域提取算法提取图像边缘二值化图中的字符初级连通域;步骤D. 按预设筛选条件,针对各个字符初级连通域进行筛选,获得各个相互独立的字符候选连通域;步骤E. 采用层次聚类算法针对具有邻接关系的字符候选连通域进行聚类,获得文本初级候选区域集合;步骤F. 针对文本初级候选区域集合中的各个文本初级候选区域进行特征提取,并按预设文本筛选条件,针对文本候初级选区域集合进行筛选,排除非文本初级候选区域,获得文本候选区域集合;步骤G. 针对文本候选区域集合中各个文本候选区域进行特征提取,然后通过预先训练好的分类器对各个文本候选区域进行分类,排除掉伪文本候选区域,获得文本区域,即获得待检测图像中的文本区域。
地址 210019 江苏省南京市建邺区云龙山路88号烽火科技大厦A栋26F