发明名称 文档图像二值化方法
摘要 本发明涉及一种文档图像二值化方法。一种用于对文档图像进行二值化的方法,使用多阈值处理以确定用于图像的最佳全局二值化阈值。最佳二值化阈值通过以下方式确定,即,使用不同的阈值对文档进行多次二值化,并针对每个阈值计算有用信息和噪声的统计以选择最佳阈值。
申请公布号 CN106203251A 申请公布日期 2016.12.07
申请号 CN201610356483.8 申请日期 2016.05.26
申请人 柯尼卡美能达美国研究所有限公司 发明人 方刚
分类号 G06K9/00(2006.01)I;G06K9/34(2006.01)I;G06K9/38(2006.01)I 主分类号 G06K9/00(2006.01)I
代理机构 中国国际贸易促进委员会专利商标事务所 11038 代理人 金光华
主权项 一种用于对多比特文档图像进行二值化的方法,包括:(a)对所述文档图像进行多次二值化,每次使用多个不同的二值化阈值中的一个,以产生多个对应的二值图像;对于所述二值图像中的每个二值图像,(b)将连通分量分析应用于该二值图像以识别该二值图像中的连通分量;(c)识别该二值图像中的大于阈值大小并且具有比填充率阈值高的填充率的所有连通分量,并移除包含在识别的连通分量的边界框中的所有连通分量;和(d)对该二值图像中的具有等于或大于第一阈值大小的大小的连通分量的第一数量进行计数,并且对该二值图像中的具有等于或小于第二阈值大小的大小的连通分量的第二数量进行计数;(e)基于每个二值图像的第一数量和第二数量,选择所述二值图像中的一个二值图像作为最佳二值图像;和(j)输出所述最佳二值图像。
地址 美国加利福尼亚