发明名称 一种中日文字符手写在线识别的粗分类器构造方法
摘要 本发明属于文字信息处理的联机手写字符识别领域,具体涉及一种中日文字符的手写识别方法,尤其涉及一种中日文字符手写在线识别的粗分类器构造方法。本发明突破传统的分类识别方法,创建了一种粗分类器,通过对其进行线性结构设计并利用遗传算法对粗分类器的构造参数进行估计,从而达到优化字符识别性能的目的。本发明用于中日文字符的手写联机识别,识别速度快,识别精度高,所占内存小,能够适用于各种类型的手写语言处理设备中,如平板电脑、智能手机、书写板等。
申请公布号 CN106570517A 申请公布日期 2017.04.19
申请号 CN201610895639.X 申请日期 2016.10.14
申请人 上海新同惠自动化系统有限公司 发明人 刘建生
分类号 G06K9/62(2006.01)I;G06N3/12(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 上海集信知识产权代理有限公司 31254 代理人 洪玲
主权项 一种中日文字符手写在线识别的粗分类器构造方法,其主要步骤包括:步骤102,对输入的中/日文字符进行预处理和特征提取;步骤104,对输入字符进行基本特征识别;步骤106,对粗分类器进行线性结构设计;步骤108,利用遗传算法对粗分类器进行参数值优化;所述步骤102中,所述的预处理和特征提取包括离线方向特征选取、在线特征点选取、特征选取以及高斯平滑处理;所述步骤104中,所述的输入字符的基本特征识别采用的是二次判别函数法和分层搜索空间法;所述步骤106中,所述的粗分类器的线性结构节点数i为5~8,每个节点N<sub>i</sub>都有一个基本识别,每个节点N<sub>i</sub>都有O<sub>i‑1</sub>个输入候选以及O<sub>i</sub>个输出候选,O<sub>0</sub>表示为所有字符类的初始数目,每个节点Ni均有一系列的参数值(<img file="FDA0001130786640000013.GIF" wi="194" he="63" />Oi,ui),取值均为整数,<img file="FDA0001130786640000015.GIF" wi="50" he="57" />等于0‑(M_n‑1),<img file="FDA0001130786640000014.GIF" wi="45" he="63" />等于0‑(M_k‑1),Oi等于1‑Om_i(i表示最近使用的节点数字,Om_i是N<sub>i</sub>输入候选的数字),u<sub>i</sub>等于1或0。所述步骤108中,所述的使用遗传算法(GA)对参数进行优化目标速度分数如下所示:Score_t=(t<sub>max</sub>‑t<sub>whole</sub>)Num_train<maths num="0001"><math><![CDATA[<mrow><msub><mi>t</mi><mrow><mi>w</mi><mi>h</mi><mi>o</mi><mi>l</mi><mi>e</mi></mrow></msub><mo>=</mo><msub><mi>t</mi><mrow><mi>c</mi><mi>o</mi><mi>a</mi><mi>r</mi><mi>s</mi><mi>e</mi></mrow></msub><mo>+</mo><msub><mi>o</mi><mrow><mi>c</mi><mi>o</mi><mi>a</mi><mi>r</mi><mi>s</mi><mi>e</mi></mrow></msub><msubsup><mi>t</mi><mrow><mi>f</mi><mi>i</mi><mi>n</mi><mi>e</mi></mrow><mrow><mi>a</mi><mi>v</mi><mi>e</mi><mi>r</mi><mi>a</mi><mi>g</mi><mi>e</mi></mrow></msubsup><mo>+</mo><msubsup><mi>t</mi><mrow><mi>s</mi><mi>e</mi><mi>a</mi><mi>r</mi><mi>c</mi><mi>h</mi></mrow><mrow><msub><mi>o</mi><mrow><mi>c</mi><mi>o</mi><mi>a</mi><mi>r</mi><mi>s</mi><mi>e</mi></mrow></msub><mo>-</mo><msub><mi>o</mi><mrow><mi>f</mi><mi>i</mi><mi>n</mi><mi>e</mi></mrow></msub></mrow></msubsup></mrow>]]></math><img file="FDA0001130786640000011.GIF" wi="839" he="83" /></maths><maths num="0002"><math><![CDATA[<mrow><msub><mi>t</mi><mrow><mi>c</mi><mi>o</mi><mi>a</mi><mi>r</mi><mi>s</mi><mi>e</mi></mrow></msub><mo>=</mo><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mn>5</mn></munderover><mrow><mo>(</mo><msub><mi>o</mi><mrow><mi>m</mi><mo>_</mo><mi>i</mi></mrow></msub><msubsup><mi>t</mi><mi>i</mi><mrow><mi>a</mi><mi>v</mi><mi>e</mi><mi>r</mi><mi>a</mi><mi>g</mi><mi>e</mi></mrow></msubsup><mo>+</mo><msubsup><mi>t</mi><mrow><mi>s</mi><mi>e</mi><mi>a</mi><mi>r</mi><mi>c</mi><mi>h</mi></mrow><mrow><msub><mi>o</mi><mrow><mi>m</mi><mo>_</mo><mi>i</mi></mrow></msub><mo>-</mo><msub><mi>o</mi><mi>i</mi></msub></mrow></msubsup><mo>)</mo></mrow><mi>I</mi><mrow><mo>(</mo><msub><mi>u</mi><mi>i</mi></msub><mo>=</mo><mn>1</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0001130786640000012.GIF" wi="865" he="117" /></maths>其中,T<sub>max</sub>是一个非常大的常数,T<sub>whole</sub>是识别一个字符的识别时间,Num_train是训练数据的数目,t<sub>coarse</sub>是粗分类器的识别时间,O<sub>coarse</sub>是粗分类器的候选输出数,<img file="FDA0001130786640000016.GIF" wi="176" he="83" />是计算的输入模式的得分和与细分类器的候选类平均时间,O<sub>fine</sub>是细分类器输出的候选数量,<img file="FDA0001130786640000017.GIF" wi="305" he="84" />是从O<sub>coarse</sub>候选里挑选出最佳候选O<sub>finetop</sub>的搜索时间。I(.)是指示函数,当满足条件时,取1,否则取0,该条件是粗分类器输出候选的累积识别正确率大于99.9%。<img file="FDA0001130786640000018.GIF" wi="179" he="72" />是由<img file="FDA00011307866400000110.GIF" wi="112" he="63" />和<img file="FDA00011307866400000111.GIF" wi="106" he="67" />两个参数决定的识别器输入一个候选种类的平均时间;<img file="FDA0001130786640000019.GIF" wi="180" he="81" />是从O<sub>m_i</sub>候选中选取O<sub>i</sub>最好候选的搜索时间。
地址 201500 上海市金山区朱泾镇松枫公路350号769室B座