发明名称 基于多分类器的手写体字符识别拒识方法
摘要 基于多分类器的手写体字符识别拒识方法,属于手写字符识别领域。将拒识方法引入手写体字符识别系统,可以有效提高识别系统的可靠性,从而提高识别系统的识别率。该发明提出了一种基于单分类器的拒识方法和一种基于多分类器的拒识方法。针对单个特征拒识方法存在的局限性,采用多分类器系统的思想为每一种特征设计单独的分类器,进而对各分类器的拒识结果进行集成,可以发挥各种特征的优势,进一步提高拒识的可靠性。该发明以单分类器拒识方法为基础,给出多分类器拒识方法。该方法可以更好的解决手写体识别系统的识别率和拒识率之间的矛盾,提高识别系统的可靠性。
申请公布号 CN101630367A 申请公布日期 2010.01.20
申请号 CN200910089147.1 申请日期 2009.07.31
申请人 北京科技大学 发明人 殷绪成;郝红卫;唐云峰
分类号 G06K9/62(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 代理人
主权项 1、基于多分类器的手写体字符识别拒识方法,其特征在于:所述方法由两个或两个以上的单分类器拒识结果为基础的多分类器拒识方法;其中单分类器拒识方法分为三个步骤:初始归一化、置信度计算和拒识;将两个或两个以上的单分类器拒识方法所得到的结果,通过投票组合方式或线性组合方法,最终得到拒识结果;1)初始归一化选取归一化函数的一个基本原则是:分类器的输出经归一化函数的变换将分布在0附近,经过归一化函数变换的置信度的理想值能表示输入模式属于一个具体类别的概率;确定分类器输出范围的一个简单的方法是将输出变换到均值为0,标准差为1,即:<maths num="0001"><![CDATA[<math><mrow><msub><mi>f</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>d</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mi>d</mi><mo>-</mo><msub><mi>&mu;</mi><mn>0</mn></msub></mrow><msub><mi>&sigma;</mi><mn>0</mn></msub></mfrac></mrow></math>]]></maths>其中d代表分类器的输出,μ<sub>0</sub>和σ<sub>0</sub><sup>2</sup>分别代表分类器输出的均值和方差,这个归一化函数为全局归一化函数;2)置信度计算在神经网络中普遍使用的sigmoid函数,能够很好的将网络输出逼近概率分布;将其作为置信度变换的激活函数:<maths num="0002"><![CDATA[<math><mrow><msub><mi>g</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>d</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mn>1</mn><mrow><mn>1</mn><mo>+</mo><msup><mi>e</mi><mrow><mo>-</mo><msub><mi>f</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>d</mi><mo>)</mo></mrow></mrow></msup></mrow></mfrac><mo>;</mo></mrow></math>]]></maths>3)拒识输入样本为x,类别数为M,经过降序排列的识别系统的输出为<img file="A2009100891470002C3.GIF" wi="570" he="63" />对这个输出直接进行阈值操作:<maths num="0003"><![CDATA[<math><mrow><msub><mi>r</mi><mn>1</mn></msub><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mo>=</mo><msub><mi>g</mi><msub><mi>i</mi><mn>1</mn></msub></msub><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mo>&lt;</mo><msub><mi>TH</mi><mn>1</mn></msub><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>7</mn><mo>)</mo></mrow></mrow></math>]]></maths>得到0≤r<sub>1</sub>(x)≤1。
地址 100083北京市海淀区学院路30号