发明名称 一种复杂结构文档图像倾斜快速检测方法
摘要 本发明涉及一种复杂结构文档图像倾斜快速检测方法,属于文档图像处理范畴。本发明首先从图像中的文本区域及非文本区域提取连通区域的边界段作为倾斜特征,然后通过对提取的边界段进行过滤,得到鲁棒边界段及其对应的倾斜角度,最后通过倾斜角度的加权中值得到整幅图像的倾斜角度。通过大量对比实验表明,该算法具有速度快,精度高,适用范围广的特点。
申请公布号 CN100535930C 申请公布日期 2009.09.02
申请号 CN200710176208.9 申请日期 2007.10.23
申请人 北京大学 发明人 刘宏;吴奇;查红彬;陆叶
分类号 G06K9/32(2006.01)I 主分类号 G06K9/32(2006.01)I
代理机构 北京君尚知识产权代理事务所(普通合伙) 代理人 余长江
主权项 1.一种复杂结构文档图像倾斜快速检测方法,其步骤为:1)预处理文档图像,对原始图像进行噪声减除,标定连通区域;2)提取大连通区域边界段,同时移除大连通区域,若不存在大连通区域则跳到下一步;3)连接文字行和相邻区域,提取边界段;所述连接文字行和相邻区域的方法为:I)计算横向和纵向平均距离,其方法如下:①定义两个参数:横向有效距离个数h_sum和总距离dist,并将二者初始化为0;②对图像进行逐行遍历:对于同一行的两个相邻的前景像素,计算相邻两个像素之间背景像素的个数n,如果满足0<n<n_max,则有h_sum=h_sum+1,dist=dist+n,其中n_max为最大间隔阈值;③通过h_dist=dist/h_sum得到横向平均距离h_dist;同理,定义并求出纵向有效距离个数v_sum,纵向平均距离v_dist;II)判断文档图像的主方向,其规则如下:①若h_sum>3×v_sum,则主方向为横向;②若v_sum>3×h_sum,则主方向为纵向;③若①,②均不满足,则比较h_dist,v_dist,如果h_dist<v_dist,则主方向为横向,反之,主方向为纵向;III)采用行程长(Run-Length)算法沿主方向进行相邻区域连接;所述提取边界段的方法为:a)对每个连通区域,判断其宽度大小,如果其宽度大于某一阈值min_size,则转到b),否则,转到g);b)从上到下提取该区域的上边界:从左到右,对该区域的每一列进行遍历,记录遇到的第一个前景像素的位置(x,y),然后退出对这一列的遍历,开始对下一列进行遍历;c)对b)已经提取的边界点序列,按从左到右的顺序,每10个点一组,选取最靠上的一个点,如果有若干个点y值相同,选x最小的一点;将选出的点组成抽样边界序列;d)抽样边界点序列可记做pi(xi,yi),i=1,2,…,n,其中,pi-1是pi左邻的抽样点,初始化两个变量start和end,令它们的值为1;e)遍历抽样点,对每个i,如果(i=n)或者(dv=|yi-yi+1|>max_fall),则令end=i;其中,max_fall为落差阈值;f)如果(end-start)>min_length则记录i值从start到end的抽样点,作为候选边界段,令start=end+1;其中,min_length为边界段长度阈值;g)结束;同理可以实现其他边界的提取;4)对提取的边界段进行过滤,得到可靠的倾斜特征;所述边界段过滤的方法为:I)采用主成分分析方法计算边界段的两个特征值λbig和λsmall,其对应的特征向量表示该边界段的主方向和垂直主方向的方向;II)定义参数δ,δ=λsmall/λbig,用于度量边界段的线性程度;III)判断每个边界段的δ值,如果δ大于设定的阈值,则将该边界段视为不可靠边界段,予以舍弃;反之,则视该边界段为可靠的倾斜特征;5)根据倾斜特征计算整幅文档图像的倾斜角度。
地址 100871北京市海淀区颐和园路5号