发明名称 基于局部结构分析的直线移除方法
摘要 本发明涉及一种基于局部结构分析的直线移除方法,首先进行文档的初次简单二值化工作,然后进行倾斜矫正;在简单二值化工作后图像中精确定位其中所有框线线段,然后根据先验知识筛选出需要进行移除处理的线段部分并记录其位置信息;在原始彩色图像文档中查找到获取的需要进行移除的线段,并从每条线段起点至终点的上下区域内求取文字与线段的交点;根据局部像素位置关系执行相应的直线移除策略,并根据线段的彩色像素均值信息以及不同直线移除策略执行结果的单字符识别置信度,确定最适宜的直线移除区域,最终用背景像素覆盖直线移除区域,即可得到直线移除后的图像。本发明方法能够克服局部结构发生破坏,造成文字切分、识别失败的缺点与不足。
申请公布号 CN105069452B 申请公布日期 2016.09.14
申请号 CN201510482060.6 申请日期 2015.08.07
申请人 武汉理工大学 发明人 苏义鑫;裴嘉政;张丹红
分类号 G06K9/32(2006.01)I 主分类号 G06K9/32(2006.01)I
代理机构 武汉开元知识产权代理有限公司 42104 代理人 潘杰;胡红林
主权项 一种基于局部结构分析的直线移除方法,其特征在于,包括:S100、输入原始彩色图像文档,先进行文档的初次简单二值化工作,然后进行倾斜矫正;步骤S100中,所述倾斜矫正针对的是输入文本图像整体倾斜的前期图像处理过程,根据二值化图像的水平投影直方图或检测出的表格框线进行图像旋转从而实现矫正。按照水平投影直方图矫正方法,尝试旋转图像至某一角度θ后,统计一次文档图像水平投影hist[row]<sub>θ</sub>,通过不断获取θ=±1,2,3,...,n角度下的水平投影,使水平投影行之间的方差最大时的θ即为待旋转的角度;按照表格框线进行矫正的方法,可根据文档中预印表格的水平或垂直框线在文档图像中的夹角,来确定其应当旋转矫正的角度θ;S200、在所述简单二值化工作后图像中精确定位其中所有框线线段,然后根据先验知识筛选出需要进行移除处理的线段部分并记录其位置信息;S300、在原始彩色图像文档中查找到步骤S200中获取的需要进行移除的线段,并从每条线段起点至终点的上下区域内求取文字与线段的交点;对原始彩色图像中相应位置的表格框线的两侧边缘进行梯度分析,用以确定在线段两侧是否存在字符笔画,以及字符笔画与线段之间的交点,从而实现从每条线段起点至终点的上下区域内求取文字与线段的交点,具体步骤如下:首先,将原始彩色图像u<sub>0</sub>转换到灰度形式u,根据公式<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>u</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>=</mo><mn>255</mn><mo>-</mo><mn>0.5</mn><mrow><mo>(</mo><mfrac><mn>1</mn><mi>n</mi></mfrac><munderover><mo>&Sigma;</mo><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msub><mi>u</mi><mrow><mn>0</mn><mo>,</mo><mi>k</mi></mrow></msub><mo>(</mo><mrow><mi>i</mi><mo>,</mo><mi>j</mi></mrow><mo>)</mo><mo>+</mo><munder><mrow><mi>m</mi><mi>i</mi><mi>n</mi></mrow><mi>k</mi></munder><msub><mi>u</mi><mrow><mn>0</mn><mo>,</mo><mi>k</mi></mrow></msub><mo>(</mo><mrow><mi>i</mi><mo>,</mo><mi>j</mi></mrow><mo>)</mo><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000927341470000011.GIF" wi="878" he="134" /></maths>完成上述转换;然后,根据步骤S200中检测出的线段的上、下边缘处,通过Sobel边缘检测算子沿上、下边缘方向进行处理,当线段与其他文字笔画相交时,在灰度图像该点处u(x,y)会呈现明显的梯度极值,根据边缘处的梯度变化,初步估计出该框线与文字的关系是属于:相交、压盖、或者相离;S400、根据局部像素位置关系执行相应的直线移除策略,并根据线段的彩色像素均值信息以及不同直线移除策略执行结果的单字符识别置信度,确定最适宜的直线移除区域,最终用背景像素覆盖直线移除区域,即可得到直线移除后的图像;所述直线移除策略包括:分析上下边缘处的梯度极值点,其中每一负、正极值点构成一对笔画相交点对,若某侧边缘处的极值点对在另一侧找到对应的极值点对,即为笔画穿透,若未能找到匹配的另一侧极值点对,则为笔画未穿透;当笔画穿透时,此时直线移除的策略为保留这4个点所构成的四边形区域内部像素点即可;框线宽度大于等于笔画宽度时,发生框线正好覆盖于某一小段笔画之上的现象,即为笔画压盖;对于笔画未穿透、笔画压盖情形时,首先根据直接移除直线后的图像进行连通域分析,获取每个字符所在的区块,然后进行:a)在彩色图像上的移除直线区域中,查找与字符像素RGB色彩空间距离较近的像素点;b)在此区块中应用OCR识别引擎,若上一步a)中能够区分出属于字符或框线的像素点,此时能够得到较高置信度的识别结果,反之,通过色彩空间距离无法区分出属于字符或框线的像素点,此时先保留直线移除区域,待后期进行处理。
地址 430070 湖北省武汉市洪山区珞狮路122号