发明名称 复杂干扰下字符串的分割与识别方法
摘要 本发明公开了一种复杂干扰下字符串的分割与识别方法,其特征是:在学阶段,将包含有m个字符的图像切分成m份图片,构成多示例学的包,并将同一字符作为一类,将包归类入库。再计算包的积分图,提取出包的haar-like特征作为包的示例,并使用多样性密度算法找到各类的关键示例,最后利用SVM的分类性能,对关键示例进行学。在识别阶段,利用学的结果预测新包的类型,实现对字符串的识别。本发明能实现复杂干扰下的字符串自动识别功能,且识别速度和效率较高。
申请公布号 CN102722736A 申请公布日期 2012.10.10
申请号 CN201210193246.6 申请日期 2012.06.13
申请人 合肥工业大学 发明人 汪荣贵;戴经成;周良;李想;游生福;查炜
分类号 G06K9/66(2006.01)I;G06K9/34(2006.01)I 主分类号 G06K9/66(2006.01)I
代理机构 安徽省合肥新安专利代理有限责任公司 34101 代理人 何梅生
主权项 1.一种复杂干扰下字符串的分割与识别方法,其特征按如下过程进行:Ⅰ、学习阶段:利用多示例机器学习的方法按如下步骤对复杂干扰下字符串进行学习;步骤1、获取多示例学习的各个包;将包含有干扰的m个字符图像切分成m份图片;每一份图片包含且仅包含一个完整的字符;将所述m份图片作为多示例学习的m个包,以所述m个包分别入库;所述分别入库是指将同一字符作为同一类,放入在同一个文件夹中,获得与类的数量相一致的n个文件夹,所述n不大于m;步骤2、利用haar-like特征原型提取haar-like特征作为包的示例;若所述图像不是灰度图像,则先将库内的每一个包进行灰度化处理,再按式(1)计算包的积分图;若所述图像是灰度图像,则利用式(1)计算包的积分图ii:<maths num="0001"><![CDATA[<math><mrow><mi>ii</mi><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>=</mo><munder><mi>&Sigma;</mi><mrow><mi>i</mi><mo>&le;</mo><mi>x</mi><mo>,</mo><mi>j</mi><mo>&le;</mo><mi>y</mi></mrow></munder><mi>img</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow></math>]]></maths>式(1)中ii(x,y)表示图像中横坐标i≤x,纵坐标j≤y的所有像素之和;采用haar-like特征原型在所述包的积分图中提取haar-like特征作为包的示例;所述包的示例由向量表示,所述向量的每一个分量对应每一个haar-like特征原型所提取的特征值;步骤3、利用多样性密度算法找到库中每一类的多样性密度最大的前u个包的示例<img file="FDA00001758006800012.GIF" wi="186" he="57" />作为该类的关键示例;步骤4、将每一类的关键示例作为SVM分类器样本进行分类;按照类的个数n训练出n个SVM分类器,将所述n个SVM分类器构造成一棵二叉决策树,每个SVM分类器为所述二叉决策树的每个节点;所述每个SVM分类器按如下方法获得;将库中某一类的关键示例作为SVM分类器学习的正样本:<img file="FDA00001758006800013.GIF" wi="502" he="68" />从库中其它类中的所有关键示例中任意选取u个关键示例,作为SVM分类器学习的负样本:<img file="FDA00001758006800014.GIF" wi="653" he="72" />以所述正样本和负样本通过SVM算法训练得到式(7)所表征的SVM分类器f(t):f(t)=sgn(&lt;W<sup>*</sup>,t&gt;+b<sup>*</sup>)    (2)式(2)中,b<sup>*</sup>为设定的阈值,t为待分类的学习样本,W<sup>*</sup>为权重向量;Ⅱ、识别阶段:利用所述多示例机器学习方法获得的SVM分类器f(t)对复杂干扰下字符串进行识别;以最小的字符大小作为初始扫描矩形特征窗口,自左至右、再自上而下,扫描图像经切分后的每个图片;计算扫描窗口内的矩形特征值,得到特征向量T,将所述特征向量T从所述二叉决策树顶端按照从上到下的顺序代入每个节点,利用式(3)计算获得f(T):f(T)=sgn(&lt;W<sup>*</sup>,T&gt;+b<sup>*</sup>)    (3)直到f(T)大于0时,分类结束,输出识别结果;若特征向量T带入所述二叉决策树的最后一个节点计算后,f(T)仍小于0,则将所述初始扫描矩形特征窗口以固定倍率扩大后,再带入所述二叉决策树顶端的每个节点进行计算,直至f(T)&gt;0,则分类结束,输出识别结果,若所述初始扫描矩形特征窗口的大小扩大到大于最大字符时,仍然未找到f(T)&gt;0,则表示识别失败。
地址 230009 安徽省合肥市屯溪路193号