发明名称 一种用于联机手写汉字识别的汉字笔画特征提取方法
摘要 本发明提供一种用于联机手写汉字识别的汉字笔画特征提取方法,其方法主要通过对联机手写汉字的时间序列进行真实笔画和虚拟笔画处理,进而提取用于文字识别的笔画特征。本发明融合联机手写汉字的虚拟笔画特征和无虚拟笔画特征,采用融合后的特征进行联机手写体识别,可以大大提高对连笔草书汉字的识别效果,不仅能识别规范书写的汉字,也能够对连笔草书汉字进行识别,故而可以让用户无限制地自由书写汉字。
申请公布号 CN101604393A 申请公布日期 2009.12.16
申请号 CN200910041047.1 申请日期 2009.07.10
申请人 华南理工大学 发明人 金连文;邓国强
分类号 G06K9/46(2006.01)I 主分类号 G06K9/46(2006.01)I
代理机构 广州粤高专利商标代理有限公司 代理人 何淑珍
主权项 1、一种用于联机手写汉字识别的汉字笔画特征提取方法,其特征在于包括如下步骤:(1)对联机手写汉字的时间序列进行真实笔画和虚拟笔画处理,即在所有相邻且断开的真实笔画间加入虚拟笔画,构成一个连续的书写轨迹,得到有虚拟笔画的时间序列,同时保留不添加任何虚拟笔画点的时间序列副本,即无虚拟笔画的时间序列;(2)根据步骤(1)得到的有虚拟笔画的时间序列和无虚拟笔画的时间序列,对属于真实笔画的点和属于虚拟笔画的点加以区分,即记下每个点是属于真实笔画点还是虚拟笔画点;(3)对步骤(2)的两个时间序列,采用如下方法产生最终的笔画特征:(31)定义二维平面内的八种方向,即东、西、南、北、东南、西南、东北和西北,计算每个时间序列中每一点的方向特征,点的方向特征定义从当前点的前驱到后续的一个矢量,令<img file="A2009100410470002C1.GIF" wi="42" he="67" />属于真实笔画的点的特征矢量,则将<img file="A2009100410470002C2.GIF" wi="42" he="66" />改变成<img file="A2009100410470002C3.GIF" wi="93" he="66" />k是对真实笔画点的特征矢量的一个加权系数;如果<img file="A2009100410470002C4.GIF" wi="41" he="66" />是属于虚拟笔画的点的特征矢量,则<img file="A2009100410470002C5.GIF" wi="42" he="65" />保持不变;最后将加权处理后的每一点的方向特征映射到平面内的八个方向,得到八个方向的模式图像,映射的方法是分解点特征矢量到最邻近的两个方向;(32)把每个时间序列看成一幅图像,通过把汉字图像在水平和垂直两个方向上的直方图投影画出8×8的全局弹性网格,使得每一列网格在水平方向上的直方图投影累积量相等,每一行网格在垂直方向上的直方图投影累积量相等,根据这64个弹性网格,在步骤(31)中得到八个模式图像中提取网格特征,每一个序列都可以得到512维的特征矢量。
地址 510640广东省广州市天河区五山路381号