主权项 |
一种基于边界点笔画形状的字符特征提取方法,包括如下具体步骤:(一)字符图像的预处理,获得每个字符的正方形字符图像;(二)对每个字符图像,按如下过程提取字符边界点的笔画形状特征:(1)定义边界点的笔画形状特征,具体为:对任一边界点P,计算其在方向i上的字符色像素点数在相应的像素集中所占的比重di,di=liSp,i,其中,方向i指以点P为原点作直角坐标系,沿两坐标轴所在直线、沿平分第I、III象限的直线和沿平分第II、IV象限的直线中的任一方向,i=1,2,3或4,li表示i方向上连续字符色像素点的个数,Sp,i表示为过点P作一条沿方向i的直线,落在该直线上的像素点数,则di=[d1,d2,d3,d4]构成的向量即为边界点的4维笔画形状特征,其中,所述边界点指字符图像上,在水平或垂直方向上从背景色跳变为前景色时该前景色所对应的像素点;(2)沿水平方向和垂直方向分别将单个字符图像平均分为5个水平区域和5个垂直区域;(3)对各个水平区域在水平方向上进行逐行扫描,获得各水平区域的边界点的笔画形状特征,具体过程为:(3.1)对每行像素,在水平方向上,分别从西向东和从东向西两个方向进行扫描,确定各方向上的边界点个数,并分别得到该行像素在每个方向上的笔画形状特征向量,即:如果边界点超过3个,计算前3个边界点的四维笔画形状特征,即组成该行像素的12维笔画形状特征向量;如果少于3个,先计算各边界点的四维笔画形状特征,该行像素的12维笔画形状特征向量中的剩余元素用0补齐;(3.2)根据每一行像素的12维笔画形状特征向量得到每个区域在从西向东或从东向西方向上的特征矩阵,该特征矩阵的行数等于每个区域内的像素行数;(3.3)对所述特征矩阵在列方向上求均值,即可得到每个区域在从西向东或从东向西方向上的12维边界点笔画形状特征;将各区域各方向上的边界点笔画形状特征合并为一维向量,即得到字符在水平方向上的边界点笔画形状特征;(4)对各个垂直区域在垂直方向上进行逐列扫描,获得各垂直区域的边界点的笔画形状特征;(5)将上述水平和垂直方向上的边界点笔画形状特征合并,获得字符的边界点笔画形状特征。 |