发明名称 基于单个汉字字符的字体识别方法
摘要 基于单个汉字字符的字体识别方法属于汉字字体识别领域其特征在于,它是一种利用小波变换的与文本无关的字体识别方法它根据选定的层数J,用相应的尺度函数和小波函数的离散滤波器对离散信息作卷积处理,对原始图像进行J层小波变换,得到3J+1个子图像;再把各个子图像划分为子块,以每个子块中小波系数绝对值的加权和作为特征,经过整形处理后,得到原始图像的小波特征然后再利用线性鉴别分析从小波特征中提取字体识别特征,最后用高斯模型的二次分类器进行训练和识别本发明的平均识别率可达97.35%
申请公布号 CN1238816C 申请公布日期 2006.01.25
申请号 CN03119130.4 申请日期 2003.03.14
申请人 清华大学 发明人 丁晓青;陈力;刘长松;彭良瑞;方驰
分类号 G06T5/50(2006.01);G06F17/16(2006.01);G06K9/46(2006.01) 主分类号 G06T5/50(2006.01)
代理机构 代理人
主权项 1.基于单个汉字字符的字体识别方法,其特点在于,它是一种利用小波特征的文本无关的单个汉字字符的字体识别方法,它依次含有以下步骤:(1)用小波变换方法提取小波特征:(1.1)根据选定的J表示层数,用相应的尺度函数和小波函数对应的离散滤波器H和G,对原始图像A<sub>20</sub>f即f(m<sub>x</sub>,n<sub>y</sub>),其中,m<sub>x</sub>,n<sub>y</sub>分别为图像f(m<sub>x</sub>,n<sub>y</sub>)的纵横坐标,后面用f表示,进行J层小波变换,得到3J+1个子图像,表示如下:<maths num="001"><![CDATA[ <math><mrow><msub><mi>A</mi><msup><mn>2</mn><mrow><mo>-</mo><mi>j</mi></mrow></msup></msub><mi>f</mi><mo>,</mo><msub><mrow><mo>(</mo><msubsup><mi>D</mi><msup><mn>2</mn><mi>j</mi></msup><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></msubsup><mi>f</mi><mo>)</mo></mrow><mrow><mo>-</mo><mi>J</mi><mo>&le;</mo><mi>j</mi><mo>&le;</mo><mo>-</mo><mn>1</mn></mrow></msub><mo>,</mo><msub><mrow><mo>(</mo><msubsup><mi>D</mi><msup><mn>2</mn><mi>j</mi></msup><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></msubsup><mi>f</mi><mo>)</mo></mrow><mrow><mo>-</mo><mi>J</mi><mo>&le;</mo><mi>j</mi><mo>&le;</mo><mo>-</mo><mn>1</mn></mrow></msub><mo>,</mo><msub><mrow><mo>(</mo><msubsup><mi>D</mi><msup><mn>2</mn><mi>j</mi></msup><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow></msubsup><mi>f</mi><mo>)</mo></mrow><mrow><mo>-</mo><mi>J</mi><mo>&le;</mo><mi>j</mi><mo>&le;</mo><mo>-</mo><mn>1</mn></mrow></msub></mrow></math>]]></maths>若原始图像A<sub>20</sub>f的大小为N×N,则A<sub>2-J</sub>f的大小为2<sup>-J</sup>N×2<sup>-J</sup> N,D<sub>2j</sub><sup>(1)</sup>f、D<sub>2j</sub><sup>(2)</sup>f和D<sub>2j</sub><sup>(3)</sup>f的大小各为2<sup>j</sup>N×2<sup>j</sup>N,-J≤j≤-1;(1.2)从3J+1个子图像中提取子波特征:从j=-1开始到j=-J止,按层把每个子图像划分成一定数量的子块,统计每个子块中子波系数绝对值的加权和,得到对应该子块的一维特征,把各层所有子块求得的特征进行组合,得到原始图像f的总的子波特征;(1.3)用Box-Cox变换对特征x进行修整,使之接近高斯分布:<img file="C031191300002C2.GIF" wi="584" he="200" />α为Box-Cox变换的参数,设α=0.7,对每维特征都进行以上变换,得到初始小波特征;(2)特征变换,用线性鉴别分析LDA从小波特征中提取字体识别特征,以改善特征分布,提高识别性能,它依次含有以下步骤:(2.1)用下式计算已知类别的每个类别的均值向量μ<sub>k</sub>以及所有类别的均值向量μ:<maths num="002"><![CDATA[ <math><mrow><msub><mi>&mu;</mi><mi>k</mi></msub><mo>=</mo><mfrac><mn>1</mn><msub><mi>N</mi><mi>k</mi></msub></mfrac><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>N</mi><mi>k</mi></msub></munderover><msubsup><mi>V</mi><mi>i</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><mo>,</mo></mrow></math>]]></maths><maths num="003"><![CDATA[ <math><mrow><mi>&mu;</mi><mo>=</mo><mfrac><mn>1</mn><mi>C</mi></mfrac><munderover><mi>&Sigma;</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>C</mi></munderover><msub><mi>&mu;</mi><mi>k</mi></msub></mrow></math>]]></maths>其中,V<sub>i</sub><sup>(k)</sup>为属于第k个类别的第i个样本提取的小波特征向量,N<sub>k</sub>表示第k个类别的样本个数,C表示类别数目;(2.2)用下式计算类内散度矩阵S<sub>w</sub>和类间散度矩阵S<sub>b</sub>:<maths num="004"><![CDATA[ <math><mrow><msub><mi>S</mi><mi>w</mi></msub><mo>=</mo><mfrac><mn>1</mn><mi>C</mi></mfrac><munderover><mi>&Sigma;</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>C</mi></munderover><mrow><mo>(</mo><mfrac><mn>1</mn><msub><mi>N</mi><mi>k</mi></msub></mfrac><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>N</mi><mi>k</mi></msub></munderover><mrow><mo>(</mo><msubsup><mi>V</mi><mi>i</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><mo>-</mo><msub><mi>&mu;</mi><mi>k</mi></msub><mo>)</mo></mrow><msup><mrow><mo>(</mo><msubsup><mi>V</mi><mi>i</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><mo>-</mo><msub><mi>&mu;</mi><mi>k</mi></msub><mo>)</mo></mrow><mi>T</mi></msup><mo>)</mo></mrow></mrow></math>]]></maths><maths num="005"><![CDATA[ <math><mrow><msub><mi>S</mi><mi>b</mi></msub><mo>=</mo><mfrac><mn>1</mn><mi>C</mi></mfrac><munderover><mi>&Sigma;</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>C</mi></munderover><mrow><mo>(</mo><msub><mi>&mu;</mi><mi>k</mi></msub><mo>-</mo><mi>&mu;</mi><mo>)</mo></mrow><msup><mrow><mo>(</mo><msub><mi>&mu;</mi><mi>k</mi></msub><mo>-</mo><mi>&mu;</mi><mo>)</mo></mrow><mi>T</mi></msup></mrow></math>]]></maths>(2.3)对矩阵S<sub>w</sub><sup>-1</sup>(S<sub>b</sub>+S<sub>w</sub>)进行特征值和特征向量分解,得到按值的大小降序排列的特征值{γ<sub>i</sub>,i=1,2,...,n}和特征向量{ξ<sub>i</sub>,i=1,2,...,n);(2.4)用前m个特征向量组成线性变换矩阵W=[ξ<sub>1</sub>,ξ<sub>2</sub>,...,ξ<sub>m</sub>](2.5)得到经线性鉴别分析LDA变换后的特征向量,用Y表示:                     Y=W<sup>T</sup>·V其中V是原始图像的初始小波特征向量;(3)用改进二阶分类器MQDF进行字体识别;(3.1)训练过程:(3.1.1)首先提取已知类别原始图像的小波特征,经过线性鉴别分析LDA变换后得到m维特征,对每个类别k,用下式统计其均值μ<sub>k</sub>′和协方差阵∑<sub>k</sub>:<maths num="006"><![CDATA[ <math><mrow><msubsup><mi>&mu;</mi><mi>k</mi><mo>&prime;</mo></msubsup><mo>=</mo><mfrac><mn>1</mn><msub><mi>N</mi><mi>k</mi></msub></mfrac><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>N</mi><mi>k</mi></msub></munderover><msubsup><mi>Y</mi><mi>i</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup></mrow></math>]]></maths><maths num="007"><![CDATA[ <math><mrow><msub><mi>&Sigma;</mi><mi>k</mi></msub><mo>=</mo><mfrac><mn>1</mn><msub><mi>N</mi><mi>k</mi></msub></mfrac><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>N</mi><mi>k</mi></msub></munderover><mrow><mo>(</mo><msubsup><mi>Y</mi><mi>i</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><mo>-</mo><msubsup><mi>&mu;</mi><mi>k</mi><mo>&prime;</mo></msubsup><mo>)</mo></mrow><mo>&CenterDot;</mo><msup><mrow><mo>(</mo><msubsup><mi>Y</mi><mi>i</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><mo>-</mo><msubsup><mi>&mu;</mi><mi>k</mi><mo>&prime;</mo></msubsup><mo>)</mo></mrow><mi>T</mi></msup></mrow></math>]]></maths>其中,Y<sub>i</sub><sup>(k)</sup>为属于第k个类别的第i个样本提取的小波特征向量经线性鉴别分析LDA变换后的特征向量;(3.1.2)对每个类别的协方差阵∑<sub>k</sub>进行特征值和特征向量分解,得到按值的大小降序排列的特征值{λ<sub>i</sub><sup>(k)</sup>,i=1,2,...,m}和特征向量{ζ<sub>i</sub><sup>(k)</sup>,i=1,2,...,m}(3.1.3)计算降序排列中特征值数值最小的C-l个特征值的替代值:<maths num="008"><![CDATA[ <math><mrow><mi>&lambda;</mi><mo>=</mo><mfrac><mn>1</mn><mi>C</mi></mfrac><munderover><mi>&Sigma;</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>C</mi></munderover><msubsup><mi>&lambda;</mi><mrow><mi>l</mi><mo>+</mo><mn>1</mn></mrow><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup></mrow></math>]]></maths>其中,l为小于m的正整数,m取值为256;(3.1.4)把前面得到的λ、μ<sub>k</sub>′,k=1,2,...,C、ζ<sub>i</sub><sup>(k)</sup>,k=1,2,...,C,i=1,2,...,m、λ<sub>i</sub><sup>(k)</sup>,k=1,2,...,C,i=1,2,...,l存储到识别库文件中,供后续的识别使用;(3.2)识别过程:(3.2.1)用下式计算经线性鉴别分析LDA变换后的待识类别原始图像小波特征向量Y对每个类别的判决函数g<sub>k</sub>(Y):<maths num="009"><![CDATA[ <math><mrow><msub><mi>g</mi><mi>k</mi></msub><mrow><mo>(</mo><mi>Y</mi><mo>)</mo></mrow><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>l</mi></munderover><mfrac><msup><mrow><mo>(</mo><msup><mrow><mo>(</mo><mi>Y</mi><mo>-</mo><msubsup><mi>&mu;</mi><mi>k</mi><mo>&prime;</mo></msubsup><mo>)</mo></mrow><mi>T</mi></msup><msubsup><mi>&zeta;</mi><mi>i</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><mo>)</mo></mrow><mn>2</mn></msup><msubsup><mi>&lambda;</mi><mi>i</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup></mfrac><mo>+</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mi>l</mi><mo>+</mo><mn>1</mn></mrow><mi>m</mi></munderover><mfrac><msup><mrow><mo>(</mo><msup><mrow><mo>(</mo><mi>Y</mi><mo>-</mo><msubsup><mi>&mu;</mi><mi>k</mi><mo>&prime;</mo></msubsup><mo>)</mo></mrow><mi>T</mi></msup><msubsup><mi>&zeta;</mi><mi>i</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><mo>)</mo></mrow><mn>2</mn></msup><mi>&lambda;</mi></mfrac><mo>+</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>l</mi></munderover><mi>log</mi><msubsup><mi>&lambda;</mi><mi>i</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><mo>+</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mi>l</mi><mo>+</mo><mn>1</mn></mrow><mi>m</mi></munderover><mi>log</mi><mi>&lambda;</mi></mrow></math>]]></maths>其中,λ是常数,λ的计算见前面的训练过程,Y的计算见前面的特征变换;(3.2.2)待识类别原始图像被划分为使g<sub>k</sub>(Y)取最小值的类别。
地址 100084北京市北京100084-82信箱