主权项 |
1、一种用于联机手写汉字识别的汉字笔画特征提取方法,其特征在于包括如下步骤:(1)对联机手写汉字的时间序列进行真实笔画和虚拟笔画处理,即在所有相邻且断开的真实笔画间加入虚拟笔画,构成一个连续的书写轨迹,得到有虚拟笔画的时间序列,同时保留不添加任何虚拟笔画点的时间序列副本,即无虚拟笔画的时间序列;(2)根据步骤(1)得到的有虚拟笔画的时间序列和无虚拟笔画的时间序列,对属于真实笔画的点和属于虚拟笔画的点加以区分,即记下每个点是属于真实笔画点还是虚拟笔画点;(3)对步骤(2)的两个时间序列,采用如下方法产生最终的笔画特征:(31)定义二维平面内的八种方向,即东、西、南、北、东南、西南、东北和西北,计算每个时间序列中每一点的方向特征,点的方向特征定义从当前点的前驱到后续的一个矢量,令<img file="A2009100410470002C1.GIF" wi="42" he="67" />属于真实笔画的点的特征矢量,则将<img file="A2009100410470002C2.GIF" wi="42" he="66" />改变成<img file="A2009100410470002C3.GIF" wi="93" he="66" />k是对真实笔画点的特征矢量的一个加权系数;如果<img file="A2009100410470002C4.GIF" wi="41" he="66" />是属于虚拟笔画的点的特征矢量,则<img file="A2009100410470002C5.GIF" wi="42" he="65" />保持不变;最后将加权处理后的每一点的方向特征映射到平面内的八个方向,得到八个方向的模式图像,映射的方法是分解点特征矢量到最邻近的两个方向;(32)把每个时间序列看成一幅图像,通过把汉字图像在水平和垂直两个方向上的直方图投影画出8×8的全局弹性网格,使得每一列网格在水平方向上的直方图投影累积量相等,每一行网格在垂直方向上的直方图投影累积量相等,根据这64个弹性网格,在步骤(31)中得到八个模式图像中提取网格特征,每一个序列都可以得到512维的特征矢量。 |