发明名称 用于确定文本二值化阈值的方法和设备
摘要 本发明涉及用于确定文本二值化阈值的方法、设备和存储介质。为了确定更适合对例如要用OCR加以识别的文本图像进行二值化的阈值,提出了一种确定文本二值化阈值的方法,包括:谷底确定步骤,用于确定对应于文本图像的灰度直方图的谷底的灰度值Tcenter;端点确定步骤,用于基于Tcenter获得所述谷的右端的灰度值Tend;上限阈值计算步骤,用于计算所述文本图像的上限阈值Tupper;以及最优阈值确定步骤,用于确定Tupper和Tend中较小的一个作为用于对所述文本图像进行二值化的最优阈值。所述谷底确定步骤首先寻找一个阈值区域[Tmin,Tmax],保证在直方图中只有一个谷位于该区域内,然后在[Tmin,Tmax]中寻找最优的Tcenter。
申请公布号 CN100347722C 申请公布日期 2007.11.07
申请号 CN200410081865.1 申请日期 2004.12.24
申请人 佳能株式会社 发明人 胥立丰;马小勇;赵洪生
分类号 G06K9/38(2006.01) 主分类号 G06K9/38(2006.01)
代理机构 中国国际贸易促进委员会专利商标事务所 代理人 李春晖
主权项 1.一种确定文本二值化阈值的方法,包括:谷底确定步骤,用于确定对应于文本图像的灰度直方图的谷底的灰度值Tcenter;端点确定步骤,用于基于Tcenter获得所述谷的右端的灰度值Tend;上限阈值计算步骤,用于计算所述文本图像的上限阈值Tupper;最优阈值确定步骤,用于确定Tupper和Tend中较小的一个作为用于对所述文本图像进行二值化的最优阈值;其中,所述谷底确定步骤包括:边缘探测步骤,用于探测文本图像中的边缘,用所述边缘将文本图像中的像素分为黑像素和白像素;直方图计算步骤,用于计算所有像素的灰度直方图H-All以及黑像素的黑像素直方图H-Black;最小阈值计算步骤,用于根据所述H-Black计算一个平均灰度值作为最小阈值Tmin;最大阈值计算步骤,通过利用下述方式计算最大阈值Tmax:在从Tmin到255的区间中寻找所有像素的累积直方图中所有像素的累积频率与黑像素累积直方图中黑像素的累积频率的最小比,对应于该最小比的灰度值为Tmax;谷中心计算步骤,通过在H-All中寻找在Tmin和Tmax之间的谷底中心来计算最优阈值Tcenter。
地址 日本东京