主权项 |
1、基于多分类器的手写体字符识别拒识方法,其特征在于:所述方法由两个或两个以上的单分类器拒识结果为基础的多分类器拒识方法;其中单分类器拒识方法分为三个步骤:初始归一化、置信度计算和拒识;将两个或两个以上的单分类器拒识方法所得到的结果,通过投票组合方式或线性组合方法,最终得到拒识结果;1)初始归一化选取归一化函数的一个基本原则是:分类器的输出经归一化函数的变换将分布在0附近,经过归一化函数变换的置信度的理想值能表示输入模式属于一个具体类别的概率;确定分类器输出范围的一个简单的方法是将输出变换到均值为0,标准差为1,即:<maths num="0001"><![CDATA[<math><mrow><msub><mi>f</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>d</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mi>d</mi><mo>-</mo><msub><mi>μ</mi><mn>0</mn></msub></mrow><msub><mi>σ</mi><mn>0</mn></msub></mfrac></mrow></math>]]></maths>其中d代表分类器的输出,μ<sub>0</sub>和σ<sub>0</sub><sup>2</sup>分别代表分类器输出的均值和方差,这个归一化函数为全局归一化函数;2)置信度计算在神经网络中普遍使用的sigmoid函数,能够很好的将网络输出逼近概率分布;将其作为置信度变换的激活函数:<maths num="0002"><![CDATA[<math><mrow><msub><mi>g</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>d</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mn>1</mn><mrow><mn>1</mn><mo>+</mo><msup><mi>e</mi><mrow><mo>-</mo><msub><mi>f</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>d</mi><mo>)</mo></mrow></mrow></msup></mrow></mfrac><mo>;</mo></mrow></math>]]></maths>3)拒识输入样本为x,类别数为M,经过降序排列的识别系统的输出为<img file="A2009100891470002C3.GIF" wi="570" he="63" />对这个输出直接进行阈值操作:<maths num="0003"><![CDATA[<math><mrow><msub><mi>r</mi><mn>1</mn></msub><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mo>=</mo><msub><mi>g</mi><msub><mi>i</mi><mn>1</mn></msub></msub><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mo><</mo><msub><mi>TH</mi><mn>1</mn></msub><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>7</mn><mo>)</mo></mrow></mrow></math>]]></maths>得到0≤r<sub>1</sub>(x)≤1。 |