发明名称 |
用于二值化扫描文档图像的方法 |
摘要 |
提供了一种用于二值化扫描文档图像的方法。该文档图像被初始地二值化并且从初始的二值图像提取连通的图像部分作为文字字符。基于其拓扑特征的分析将每个文字字符分类为半色调文字字符或者非半色调文字字符。拓扑特征可以是文字字符的欧拉数;欧拉数小于-2的文字字符被分类为半色调文字。然后将灰度文档图像化分为仅包含半色调文字字符的半色调文字区域和非半色调文字区域。每个区域使用它自己的像素值统计进行二值化。这消除了黑色文字对用于二值化半色调文字的阈值的影响。区域的二值图被组合以生成最终的二值图。 |
申请公布号 |
CN102592126A |
申请公布日期 |
2012.07.18 |
申请号 |
CN201110359326.X |
申请日期 |
2011.11.14 |
申请人 |
柯尼卡美能达美国研究所有限公司 |
发明人 |
俞颂阳;明伟 |
分类号 |
G06K9/38(2006.01)I;G06K9/46(2006.01)I |
主分类号 |
G06K9/38(2006.01)I |
代理机构 |
北京集佳知识产权代理有限公司 11227 |
代理人 |
朱胜;江河清 |
主权项 |
一种在数据处理装置中实现的用于二值化通过扫描基于纸的文档而生成的灰度文档图像的方法,所述方法包括以下步骤:a.识别所述灰度文档图像中的文字字符;b.基于对步骤a中识别出的每个文字字符的拓扑分析,将所述文字字符分类为半色调文字字符或者非半色调文字字符;以及c.使用仅从步骤b中分类出的半色调文字字符所获得的像素值特征来二值化半色调文字字符。 |
地址 |
美国加利福尼亚州 |