主权项 |
一种基于模板匹配的字符识别方法,其特征在于,该方法包括下述步骤:(1)获取待识别的单个字符图像;(2)首先获取待识别的字符图像中字符的原始尺度,记其宽度为w,高度为h,并在原始尺度的基础上分别增加和减少F个像素作为两个新的尺度,分别以原始尺度和两个新的尺度在原始图像中截取包含字符的子图像,得到三个子图像;F的取值范围为1~3;(3)对步骤(2)得到的三个子图像进行二值化;(4)对步骤(3)中得到的二值化处理后的图像进行归一化,得到字符的三幅二值图像;(5)将步骤(4)中得到的归一化后的同一字符的三幅二值图像分别与模板库中的每一个标准模板字符图像进行模板匹配,得到相关系数值;(6)将步骤(5)中得到27个相关系数值按大小进行排序,选择最大的相关系数值对应的标准模板字符图像,以该标准模板字符图像所对应的字符类别作为待识别字符图像的字符类别,完成识别过程;步骤(5)按照下述过程进行模板匹配:将标准模板字符图像分别在这三幅待识别字符图像上在水平方向、垂直方向和对角线方向上以1像素的位移量滑动,一共平移9个位置,对平移过程中标准模板字符图像与待识别字符图像的重叠区域分别进行模板匹配,计算它们的相关系数,一共产生27个相关系数的值;相关系数值R(x,y)作为模板匹配的度量值,其计算公式为:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>R</mi><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mi>Σ</mi><mrow><mo>(</mo><msup><mi>T</mi><mo>′</mo></msup><mrow><mo>(</mo><msup><mi>x</mi><mo>′</mo></msup><mo>,</mo><msup><mi>y</mi><mo>′</mo></msup><mo>)</mo></mrow><mo>·</mo><msup><mi>I</mi><mo>′</mo></msup><mrow><mo>(</mo><mi>x</mi><mo>+</mo><msup><mi>x</mi><mo>′</mo></msup><mo>,</mo><mi>y</mi><mo>+</mo><msup><mi>y</mi><mo>′</mo></msup><mo>)</mo></mrow><mo>)</mo></mrow></mrow><msqrt><msub><mi>Σ</mi><mrow><msup><mi>x</mi><mo>′</mo></msup><mo>,</mo><msup><mi>y</mi><mo>′</mo></msup></mrow></msub><msup><mi>T</mi><mo>′</mo></msup><msup><mrow><mo>(</mo><msup><mi>x</mi><mo>′</mo></msup><mo>,</mo><msup><mi>y</mi><mo>′</mo></msup><mo>)</mo></mrow><mn>2</mn></msup><mo>·</mo><msub><mi>Σ</mi><mrow><msup><mi>x</mi><mo>′</mo></msup><mo>,</mo><msup><mi>y</mi><mo>′</mo></msup></mrow></msub><msup><mi>I</mi><mo>′</mo></msup><msup><mrow><mo>(</mo><mi>x</mi><mo>+</mo><msup><mi>x</mi><mo>′</mo></msup><mo>,</mo><mi>y</mi><mo>+</mo><msup><mi>y</mi><mo>′</mo></msup><mo>)</mo></mrow><mn>2</mn></msup></msqrt></mfrac></mrow>]]></math><img file="FDA0000473318040000011.GIF" wi="1070" he="199" /></maths>其中:<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><msup><mi>T</mi><mo>′</mo></msup><mrow><mo>(</mo><msup><mi>x</mi><mo>′</mo></msup><mo>,</mo><msup><mi>y</mi><mo>′</mo></msup><mo>)</mo></mrow><mo>=</mo><mi>T</mi><mrow><mo>(</mo><msup><mi>x</mi><mo>′</mo></msup><mo>,</mo><msup><mi>y</mi><mo>′</mo></msup><mo>)</mo></mrow><mo>-</mo><mn>1</mn><mo>/</mo><mrow><mo>(</mo><mi>w</mi><mo>·</mo><mi>h</mi><mo>)</mo></mrow><mo>·</mo><msub><mi>Σ</mi><mrow><msup><mi>x</mi><mrow><mo>′</mo><mo>′</mo></mrow></msup><mo>,</mo><msup><mi>y</mi><mrow><mo>′</mo><mo>′</mo></mrow></msup></mrow></msub><mi>T</mi><mrow><mo>(</mo><msup><mi>x</mi><mrow><mo>′</mo><mo>′</mo></mrow></msup><mo>,</mo><msup><mi>y</mi><mrow><mo>′</mo><mo>′</mo></mrow></msup><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000473318040000021.GIF" wi="1091" he="139" /></maths><maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><msup><mi>I</mi><mo>′</mo></msup><mrow><mo>(</mo><mi>x</mi><mo>+</mo><msup><mi>x</mi><mo>′</mo></msup><mo>,</mo><mi>y</mi><mo>+</mo><msup><mi>y</mi><mo>′</mo></msup><mo>)</mo></mrow><mo>=</mo><mi>I</mi><mrow><mo>(</mo><mi>x</mi><mo>+</mo><msup><mi>x</mi><mo>′</mo></msup><mo>,</mo><msup><mrow><mi>y</mi><mo>+</mo><mi>y</mi></mrow><mo>′</mo></msup><mo>)</mo></mrow><mo>-</mo><mn>1</mn><mo>/</mo><mrow><mo>(</mo><mi>w</mi><mo>·</mo><mi>h</mi><mo>)</mo></mrow><mo>·</mo><msub><mi>Σ</mi><mrow><msup><mi>x</mi><mrow><mo>′</mo><mo>′</mo></mrow></msup><mo>,</mo><msup><mi>y</mi><mrow><mo>′</mo><mo>′</mo></mrow></msup></mrow></msub><mi>I</mi><mrow><mo>(</mo><mi>x</mi><mo>+</mo><msup><mi>x</mi><mrow><mo>′</mo><mo>′</mo></mrow></msup><mo>,</mo><mi>y</mi><mo>+</mo><msup><mi>y</mi><mrow><mo>′</mo><mo>′</mo></mrow></msup><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000473318040000022.GIF" wi="1585" he="143" /></maths>式中,I(x,y)为待识别字符图像的像素值,T(x,y)为标准模板字符图像的像素值,(x′,y′)为重叠区域的坐标值。 |