发明名称 基于局部对比度和笔画宽度估计的低质量文档图像二值化方法
摘要 本发明涉及基于局部对比度和笔画宽度估计的低质量文档图像二值化方法,步骤为:获取扫描文档图像、采用最小均值法对彩色文档图像u(x,y)进行灰度化处理,基于局部对比度的字符笔画像素检测,采用大津法(Otsu)对所得局部对比度图像进行全局最优阈值化,采用Canny算子对所得二值图像进行边缘检测,分别统计所有字符前景像素个数n<sub>fg</sub>和字符边缘像素个数n<sub>edge</sub>,计算轮廓比例<img file="DDA0000831734130000011.GIF" wi="190" he="117" />并由此估计字符笔画宽度;最后基于滑动邻域法进行图像局部二值化。本发明能较好保留字符笔画细节,在有效分割字符前景同时,还能抑制墨迹浸润、页面污渍、纹理背景及光照不均匀等现象。
申请公布号 CN105374015A 申请公布日期 2016.03.02
申请号 CN201510708525.5 申请日期 2015.10.27
申请人 湖北工业大学 发明人 熊炜;李敏;周少文;赵楠;武明虎;徐晶晶;赵诗云
分类号 G06T5/00(2006.01)I 主分类号 G06T5/00(2006.01)I
代理机构 武汉开元知识产权代理有限公司 42104 代理人 朱盛华
主权项 基于局部对比度和笔画宽度估计的低质量文档图像二值化方法,其特征在于:具体步骤如下:1)获取扫描文档图像;2)彩色图像灰度化;采用最小均值法对彩色文档图像u(x,y)进行灰度化处理,计算公式为:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>u</mi><mrow><mi>g</mi><mi>r</mi><mi>a</mi><mi>y</mi></mrow></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mn>1</mn><mn>2</mn></mfrac><mo>&lsqb;</mo><munder><mrow><mi>m</mi><mi>i</mi><mi>n</mi></mrow><mi>i</mi></munder><mrow><mo>(</mo><msub><mi>u</mi><mi>i</mi></msub><mo>(</mo><mrow><mi>x</mi><mo>,</mo><mi>y</mi></mrow><mo>)</mo><mo>)</mo></mrow><mo>+</mo><mfrac><mn>1</mn><mn>3</mn></mfrac><munder><mo>&Sigma;</mo><mi>i</mi></munder><msub><mi>u</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>&rsqb;</mo></mrow>]]></math><img file="FDA0000831734100000011.GIF" wi="757" he="126" /></maths>式中,u<sub>i</sub>(x,y)分别为R、G、B彩色分量图像,u<sub>gray</sub>(x,y)为变换后的灰度图像;3)图像局部对比度检测;定义图像的局部对比度为:<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mi>C</mi><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><msub><mi>I</mi><mrow><mi>m</mi><mi>a</mi><mi>x</mi></mrow></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>-</mo><msub><mi>I</mi><mrow><mi>m</mi><mi>i</mi><mi>n</mi></mrow></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></mrow><mrow><msub><mi>I</mi><mrow><mi>m</mi><mi>e</mi><mi>a</mi><mi>n</mi></mrow></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></mrow></mfrac></mrow>]]></math><img file="FDA0000831734100000012.GIF" wi="531" he="119" /></maths>式中,I<sub>max</sub>(x,y)、I<sub>min</sub>(x,y)和I<sub>mean</sub>(x,y)分别表示图像在其坐标(x,y)处的3×3邻域内亮度的最大值、最小值和平均值;4)Otsu全局最优阈值化;记t∈[0,L‑1]为前景与背景像素的分割阈值,p<sub>i</sub>表示其归一化直方图,前景像素占图像比例为<img file="FDA0000831734100000013.GIF" wi="253" he="111" />前景像素平均灰度值为<img file="FDA0000831734100000014.GIF" wi="374" he="117" />背景像素占图像比例为<img file="FDA0000831734100000015.GIF" wi="459" he="111" />背景像素平均灰度值为<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><msub><mi>&mu;</mi><mn>1</mn></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>=</mo><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mi>t</mi><mo>+</mo><mn>1</mn></mrow><mrow><mi>L</mi><mo>-</mo><mn>1</mn></mrow></munderover><msub><mi>ip</mi><mi>i</mi></msub><mo>/</mo><msub><mi>&omega;</mi><mn>1</mn></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>;</mo></mrow>]]></math><img file="FDA0000831734100000016.GIF" wi="379" he="118" /></maths>图像总体平均灰度值为<img file="FDA0000831734100000017.GIF" wi="223" he="119" />则确定全局最优阈值的准则是使经阈值处理后的前景与背景像素的类间方差<maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><msubsup><mi>&sigma;</mi><mi>B</mi><mn>2</mn></msubsup><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>=</mo><msub><mi>&omega;</mi><mn>0</mn></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><msup><mrow><mo>&lsqb;</mo><msub><mi>&mu;</mi><mn>0</mn></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>-</mo><msub><mi>&mu;</mi><mi>T</mi></msub><mo>&rsqb;</mo></mrow><mn>2</mn></msup><mo>+</mo><msub><mi>&omega;</mi><mn>1</mn></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><msup><mrow><mo>&lsqb;</mo><msub><mi>&mu;</mi><mn>1</mn></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>-</mo><msub><mi>&mu;</mi><mi>T</mi></msub><mo>&rsqb;</mo></mrow><mn>2</mn></msup></mrow>]]></math><img file="FDA0000831734100000018.GIF" wi="774" he="63" /></maths>最大;5)字符笔画宽度估计;采用Canny算子对步骤4)所得二值图像进行边缘检测,分别统计所有字符前景像素个数n<sub>fg</sub>和字符边缘像素个数n<sub>edge</sub>,计算轮廓比例<img file="FDA0000831734100000019.GIF" wi="191" he="118" />并由此估计字符笔画宽度;6)图像局部二值化;将邻域窗尺寸大小设为字符笔画宽度的2‑5倍,采用滑动邻域法对图像进行局部二值化处理,计算公式为:<img file="FDA0000831734100000021.GIF" wi="781" he="133" />式中,I(x,y)为(x,y)处的像素灰度值,μ<sub>s</sub>(x,y)和σ<sub>s</sub>(x,y)分别表示以(x,y)为中心的w×w邻域内所有已标记为前景像素的灰度平均值和标准偏差,常数k取值范围为0‑1。
地址 430068 湖北省武汉市洪山区李家墩特1号