发明名称 |
一种表格图像几何畸变的数字校正方法 |
摘要 |
本发明涉及计算机信息领域的图像处理技术,具体涉及一种表格图像几何畸变的数字校正方法。为解决现有技术中只能有效的对畸变文本行进行校正,当文稿中出现畸形表格非文本区域时,无法进行后续识别的问题而发明。本发明所述的方法通过对表格图像进行分析,在二值化图像上搜索并分析有效表格线段,得到属于表格的采样表格线,分析、拟合采样表格线,并将其映射到目标位置,由采样表格线带动表格内部文字而很好地校正。本发明不但能准确地校正畸形表格,而且对于表格内部文字的矫正也达到很好的效果。 |
申请公布号 |
CN100464346C |
申请公布日期 |
2009.02.25 |
申请号 |
CN200610078993.X |
申请日期 |
2006.04.29 |
申请人 |
北大方正集团有限公司;北京北大方正技术研究院有限公司;北京大学 |
发明人 |
刘芝;康凯;杜鹏飞 |
分类号 |
G06K9/20(2006.01);G06T5/00(2006.01) |
主分类号 |
G06K9/20(2006.01) |
代理机构 |
北京中博世达专利商标代理有限公司 |
代理人 |
张岱 |
主权项 |
1.一种表格图像几何畸变的数字校正方法,其特征在于,包括以下步骤:(1)对表格图像进行二值化预处理,通过版面分析获得表格区域;(2)确定有效表格线段的最小长度,并根据该长度,在二值化表格图像的表格区域中进行搜索,得到N条有效表格线段,其中N为正整数;(3)根据有效表格线段的位置信息合并有效表格线段并形成表格线域;(4)根据所述表格线域中包含的有效表格线段信息,选择垂直方向上任意一条表格线域作为采样表格线域,求出采样表格线域中有效表格线段集合的水平方向上的上下外轮廓,即曲线的上下沿,对每一对上下沿求垂直方向上的坐标值的平均值,得到中点,将相邻的中点连接起来形成采样表格线域的采样表格线,若采样表格线不连续,则采用曲线拟合方式连接;(5)根据采样表格线上每一点在垂直方向上的坐标值的平均值确定采样表格线要校正到的目标位置,将采样表格线校正到该目标位置;(6)根据采样表格线的目标位置来定位并以平移或插值填充的方式来校正表格内采样表格线外的其他像素。 |
地址 |
100871北京市海淀区成府路298号中关村方正大厦 |