发明名称 一种基于模板匹配的字符识别方法
摘要 一种基于模板匹配的字符识别方法,属于模式识别与图像处理技术领域,具体涉及图像匹配及识别,本方法可以对字符图像进行识别。目的是开发一种简单快速有效的字符识别方法,从而能够获取图像中的字符信息。本发明主要包含如下几个处理单元:图像尺度变换、图像二值化、图像归一化、模板匹配及字符判别。在整个处理过程中,对OTSU分割、图像缩放、上下文信息、模板匹配等方法进行了综合的应用。本发明可以(但不限于)应用于实时的车牌识别系统中的字符识别模块。
申请公布号 CN102663377B 申请公布日期 2014.08.27
申请号 CN201210067861.2 申请日期 2012.03.15
申请人 华中科技大学 发明人 王岳环;唐为林;桑农;李驰;朱秀峰;宋萌萌;江曼;党小迪;王军
分类号 G06K9/20(2006.01)I;G06K9/00(2006.01)I 主分类号 G06K9/20(2006.01)I
代理机构 华中科技大学专利中心 42201 代理人 曹葆青
主权项 一种基于模板匹配的字符识别方法,其特征在于,该方法包括下述步骤:(1)获取待识别的单个字符图像;(2)首先获取待识别的字符图像中字符的原始尺度,记其宽度为w,高度为h,并在原始尺度的基础上分别增加和减少F个像素作为两个新的尺度,分别以原始尺度和两个新的尺度在原始图像中截取包含字符的子图像,得到三个子图像;F的取值范围为1~3;(3)对步骤(2)得到的三个子图像进行二值化;(4)对步骤(3)中得到的二值化处理后的图像进行归一化,得到字符的三幅二值图像;(5)将步骤(4)中得到的归一化后的同一字符的三幅二值图像分别与模板库中的每一个标准模板字符图像进行模板匹配,得到相关系数值;(6)将步骤(5)中得到27个相关系数值按大小进行排序,选择最大的相关系数值对应的标准模板字符图像,以该标准模板字符图像所对应的字符类别作为待识别字符图像的字符类别,完成识别过程;步骤(5)按照下述过程进行模板匹配:将标准模板字符图像分别在这三幅待识别字符图像上在水平方向、垂直方向和对角线方向上以1像素的位移量滑动,一共平移9个位置,对平移过程中标准模板字符图像与待识别字符图像的重叠区域分别进行模板匹配,计算它们的相关系数,一共产生27个相关系数的值;相关系数值R(x,y)作为模板匹配的度量值,其计算公式为:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>R</mi><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mi>&Sigma;</mi><mrow><mo>(</mo><msup><mi>T</mi><mo>&prime;</mo></msup><mrow><mo>(</mo><msup><mi>x</mi><mo>&prime;</mo></msup><mo>,</mo><msup><mi>y</mi><mo>&prime;</mo></msup><mo>)</mo></mrow><mo>&CenterDot;</mo><msup><mi>I</mi><mo>&prime;</mo></msup><mrow><mo>(</mo><mi>x</mi><mo>+</mo><msup><mi>x</mi><mo>&prime;</mo></msup><mo>,</mo><mi>y</mi><mo>+</mo><msup><mi>y</mi><mo>&prime;</mo></msup><mo>)</mo></mrow><mo>)</mo></mrow></mrow><msqrt><msub><mi>&Sigma;</mi><mrow><msup><mi>x</mi><mo>&prime;</mo></msup><mo>,</mo><msup><mi>y</mi><mo>&prime;</mo></msup></mrow></msub><msup><mi>T</mi><mo>&prime;</mo></msup><msup><mrow><mo>(</mo><msup><mi>x</mi><mo>&prime;</mo></msup><mo>,</mo><msup><mi>y</mi><mo>&prime;</mo></msup><mo>)</mo></mrow><mn>2</mn></msup><mo>&CenterDot;</mo><msub><mi>&Sigma;</mi><mrow><msup><mi>x</mi><mo>&prime;</mo></msup><mo>,</mo><msup><mi>y</mi><mo>&prime;</mo></msup></mrow></msub><msup><mi>I</mi><mo>&prime;</mo></msup><msup><mrow><mo>(</mo><mi>x</mi><mo>+</mo><msup><mi>x</mi><mo>&prime;</mo></msup><mo>,</mo><mi>y</mi><mo>+</mo><msup><mi>y</mi><mo>&prime;</mo></msup><mo>)</mo></mrow><mn>2</mn></msup></msqrt></mfrac></mrow>]]></math><img file="FDA0000473318040000011.GIF" wi="1070" he="199" /></maths>其中:<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><msup><mi>T</mi><mo>&prime;</mo></msup><mrow><mo>(</mo><msup><mi>x</mi><mo>&prime;</mo></msup><mo>,</mo><msup><mi>y</mi><mo>&prime;</mo></msup><mo>)</mo></mrow><mo>=</mo><mi>T</mi><mrow><mo>(</mo><msup><mi>x</mi><mo>&prime;</mo></msup><mo>,</mo><msup><mi>y</mi><mo>&prime;</mo></msup><mo>)</mo></mrow><mo>-</mo><mn>1</mn><mo>/</mo><mrow><mo>(</mo><mi>w</mi><mo>&CenterDot;</mo><mi>h</mi><mo>)</mo></mrow><mo>&CenterDot;</mo><msub><mi>&Sigma;</mi><mrow><msup><mi>x</mi><mrow><mo>&prime;</mo><mo>&prime;</mo></mrow></msup><mo>,</mo><msup><mi>y</mi><mrow><mo>&prime;</mo><mo>&prime;</mo></mrow></msup></mrow></msub><mi>T</mi><mrow><mo>(</mo><msup><mi>x</mi><mrow><mo>&prime;</mo><mo>&prime;</mo></mrow></msup><mo>,</mo><msup><mi>y</mi><mrow><mo>&prime;</mo><mo>&prime;</mo></mrow></msup><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000473318040000021.GIF" wi="1091" he="139" /></maths><maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><msup><mi>I</mi><mo>&prime;</mo></msup><mrow><mo>(</mo><mi>x</mi><mo>+</mo><msup><mi>x</mi><mo>&prime;</mo></msup><mo>,</mo><mi>y</mi><mo>+</mo><msup><mi>y</mi><mo>&prime;</mo></msup><mo>)</mo></mrow><mo>=</mo><mi>I</mi><mrow><mo>(</mo><mi>x</mi><mo>+</mo><msup><mi>x</mi><mo>&prime;</mo></msup><mo>,</mo><msup><mrow><mi>y</mi><mo>+</mo><mi>y</mi></mrow><mo>&prime;</mo></msup><mo>)</mo></mrow><mo>-</mo><mn>1</mn><mo>/</mo><mrow><mo>(</mo><mi>w</mi><mo>&CenterDot;</mo><mi>h</mi><mo>)</mo></mrow><mo>&CenterDot;</mo><msub><mi>&Sigma;</mi><mrow><msup><mi>x</mi><mrow><mo>&prime;</mo><mo>&prime;</mo></mrow></msup><mo>,</mo><msup><mi>y</mi><mrow><mo>&prime;</mo><mo>&prime;</mo></mrow></msup></mrow></msub><mi>I</mi><mrow><mo>(</mo><mi>x</mi><mo>+</mo><msup><mi>x</mi><mrow><mo>&prime;</mo><mo>&prime;</mo></mrow></msup><mo>,</mo><mi>y</mi><mo>+</mo><msup><mi>y</mi><mrow><mo>&prime;</mo><mo>&prime;</mo></mrow></msup><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000473318040000022.GIF" wi="1585" he="143" /></maths>式中,I(x,y)为待识别字符图像的像素值,T(x,y)为标准模板字符图像的像素值,(x′,y′)为重叠区域的坐标值。
地址 430074 湖北省武汉市洪山区珞喻路1037号