发明名称 一种基于边界点笔画形状的字符特征提取方法及应用
摘要 本发明公开了一种基于边界点笔画形状的字符特征提取方法,包括(一)字符图像的预处理,获得字符的正方形字符图像;(二)对每个字符图像,提取字符边界点的笔画形状特征:(1)定义边界点的笔画形状特征;(2)沿水平方向和垂直方向分别将单元字符图像平均分为5个水平和垂直区域;(3)获得各水平区域的由西至东和由东至西方向的边界点笔画形状特征(4)获得各垂直区域的由南至北和由北至南方向的边界点笔画形状特征;(5)将各方向上的边界点笔画形状特征合并,获得字符的边界点笔画形状特征。本发明还公开了一种字符识别的方法。本发明识别准确率能达到99%以上,提取的特征维数合理,可适用于特征模板匹配,神经网络、SVM等分类器识别。
申请公布号 CN102629322B 申请公布日期 2014.03.26
申请号 CN201210063621.5 申请日期 2012.03.12
申请人 华中科技大学 发明人 汪国有;朱曼瑜;吴红岩;陈明华
分类号 G06K9/20(2006.01)I;G06K9/46(2006.01)I 主分类号 G06K9/20(2006.01)I
代理机构 华中科技大学专利中心 42201 代理人 李佑宏
主权项 一种基于边界点笔画形状的字符特征提取方法,包括如下具体步骤:(一)字符图像的预处理,获得每个字符的正方形字符图像;(二)对每个字符图像,按如下过程提取字符边界点的笔画形状特征:(1)定义边界点的笔画形状特征,具体为:对任一边界点P,计算其在方向i上的字符色像素点数在相应的像素集中所占的比重di,di=liSp,i,其中,方向i指以点P为原点作直角坐标系,沿两坐标轴所在直线、沿平分第I、III象限的直线和沿平分第II、IV象限的直线中的任一方向,i=1,2,3或4,li表示i方向上连续字符色像素点的个数,Sp,i表示为过点P作一条沿方向i的直线,落在该直线上的像素点数,则di=[d1,d2,d3,d4]构成的向量即为边界点的4维笔画形状特征,其中,所述边界点指字符图像上,在水平或垂直方向上从背景色跳变为前景色时该前景色所对应的像素点;(2)沿水平方向和垂直方向分别将单个字符图像平均分为5个水平区域和5个垂直区域;(3)对各个水平区域在水平方向上进行逐行扫描,获得各水平区域的边界点的笔画形状特征,具体过程为:(3.1)对每行像素,在水平方向上,分别从西向东和从东向西两个方向进行扫描,确定各方向上的边界点个数,并分别得到该行像素在每个方向上的笔画形状特征向量,即:如果边界点超过3个,计算前3个边界点的四维笔画形状特征,即组成该行像素的12维笔画形状特征向量;如果少于3个,先计算各边界点的四维笔画形状特征,该行像素的12维笔画形状特征向量中的剩余元素用0补齐;(3.2)根据每一行像素的12维笔画形状特征向量得到每个区域在从西向东或从东向西方向上的特征矩阵,该特征矩阵的行数等于每个区域内的像素行数;(3.3)对所述特征矩阵在列方向上求均值,即可得到每个区域在从西向东或从东向西方向上的12维边界点笔画形状特征;将各区域各方向上的边界点笔画形状特征合并为一维向量,即得到字符在水平方向上的边界点笔画形状特征;(4)对各个垂直区域在垂直方向上进行逐列扫描,获得各垂直区域的边界点的笔画形状特征;(5)将上述水平和垂直方向上的边界点笔画形状特征合并,获得字符的边界点笔画形状特征。
地址 430074 湖北省武汉市洪山区珞喻路1037号