发明名称 |
一种识别扫描图像中表格单元的方法及装置 |
摘要 |
本发明公开了一种识别扫描图像中表格单元的方法及装置,包括:获取表格文档的扫描图像中的水平线段和垂直线段;去除扫描图像中小于第一阈值的水平线段和垂直线段,所述第一阈值根据扫描图像中的最小字符高度和扫描图像的分辨率设定;根据剩余的水平线段和垂直线段识别扫描图像中的表格单元。使用本发明,不仅具有传统直线检测算法识别成功率高的特点,还能够在保证高识别率的前提下,提高扫描图像中表格单元识别速度。 |
申请公布号 |
CN101676930A |
申请公布日期 |
2010.03.24 |
申请号 |
CN200810222480.0 |
申请日期 |
2008.09.17 |
申请人 |
北大方正集团有限公司;北京大学;北京北大方正电子有限公司 |
发明人 |
亓文法;李晓龙 |
分类号 |
G06K9/20(2006.01)I |
主分类号 |
G06K9/20(2006.01)I |
代理机构 |
北京同达信恒知识产权代理有限公司 |
代理人 |
郭润湘 |
主权项 |
1、一种识别扫描图像中表格单元的方法,其特征在于,包括如下步骤:获取表格文档的扫描图像中的水平线段和垂直线段;去除扫描图像中小于第一阈值的水平线段和垂直线段,所述第一阈值根据扫描图像中的最小字符高度和扫描图像的分辨率设定;根据剩余的水平线段和垂直线段识别扫描图像中的表格单元。 |
地址 |
100871北京市海淀区成府路298号中关村方正大厦9层 |