发明名称 |
一种融合全局和局部信息的表格线提取方法 |
摘要 |
一种融合全局和局部信息的表格线提取方法,结合了图像中的局部信息与全局信息。首先对灰度图像进行平滑去噪,其次进行基于交叠窗口的图像二值化;随后提取出前景区域中的局部轮廓,利用局部轮廓信息检测出图像中的直线段;之后使用投影直方图法建立网格,获得表格在图像上的全局分布信息,确定出表格的大致位置;最后,在网格范围内对直线段进行连接,从而提取出整个表格线。根据实验结果统计,按照本发明的方法提取图像中表格线的误检率小于5%,漏检率小于3%。 |
申请公布号 |
CN103258201A |
申请公布日期 |
2013.08.21 |
申请号 |
CN201310148878.5 |
申请日期 |
2013.04.26 |
申请人 |
四川大学 |
发明人 |
王俊峰;高琳;姬郁林;李虹 |
分类号 |
G06K9/46(2006.01)I;G06K9/20(2006.01)I |
主分类号 |
G06K9/46(2006.01)I |
代理机构 |
成都信博专利代理有限责任公司 51200 |
代理人 |
舒启龙 |
主权项 |
一种融合全局和局部信息的表格线提取方法,其特征是,包括以下步骤:步骤一:输入表格图像,得到初始灰度图像;步骤二:对初始灰度图像进行高斯平滑去噪,得到灰度图像;步骤三:在灰度图像上设置一个以上矩形窗口,采用最大类间方差方法对上述所有矩形窗口覆盖的局部灰度图像进行二值化处理,得到每个局部灰度图像的二值化结果;融合所有局部灰度图像的二值化结果得到所述灰度图像的二值图像;步骤四:从二值图像中提取前景区域,使用连通体分析法获得一个以上的连通的前景区域,从每一个连通的前景区域提取前景轮廓;步骤五:选取一个前景轮廓,搜索前景轮廓中包含的直线段部分;分别处理所有的前景轮廓,得到直线段;步骤六:将上述直线段按长度从大到小排序,选择前几个直线段,计算每个直线段相对于水平方向的倾斜角度;对倾斜角度排序后取中值作为二值图像的倾斜角度,对二值图像进行倾斜校正,使其处于水平状态;步骤七:从倾斜校正后的二值图像中重新提取前景区域,在水平和垂直方向上分别统计前景区域像素行和列中的像素个数,建立这两个方向上的投影直方图;采用Mean‑Shift算法定位出投影直方图中的每一个波峰,然后在波峰位置处引出网格线,建立图像网格;步骤八:去除与网格线配准度低的直线段,计算剩下的不同直线段端点之间在网格线上的流形距离;如果距离小于设定的阈值,则沿着网格线的方向进行连接,提取出表格的单元格,将所有单元格对齐后得到最终的表格线。 |
地址 |
610065 四川省成都市武侯区一环路南一段24号 |