发明名称 基于组合分类器的手写识别方法
摘要 本发明公开了一种基于组合分类器的手写汉字识别方法,优点在于对采集到的手写输入汉字的进行平滑滤波、噪声剔除、重采样及数据线性归一化处理后,进行离群点剔除处理,剔除那些偏离手写输入汉字的笔段大于设定的阈值的点,有利于笔划的转折点的提取以及笔段的正确输入;建立基本笔段类型及与其相对应的参数特征是为了在采样时可根据手写输入汉字的采样点的时间间隔确定分隔点,进行分割,当某一笔段的笔段方向偏移在设定的角度门限范围内时,自动矫正该笔段;建立了相离连接关系,对一些实际相连而因书写惯产生相离的,识别后做相连处理,可很好的区分一些较接近的汉字;通过求取Freeman链码,利用整字识别分类器,可方便地识别出手写输入汉字。
申请公布号 CN101290659B 申请公布日期 2011.06.01
申请号 CN200810062115.8 申请日期 2008.05.29
申请人 宁波新然电子信息科技发展有限公司 发明人 何加铭;沈钱波;贾德祥;杨任尔;曾兴斌
分类号 G06K9/62(2006.01)I;G06K9/36(2006.01)I;G06K9/46(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 宁波奥圣专利代理事务所(普通合伙) 33226 代理人 程晓明
主权项 一种基于组合分类器的手写汉字识别方法,该方法包括以下步骤:第①步,接收书写在手写输入设备的用户接口上的手写输入汉字;第②步,对手写输入汉字进行预处理;第③步,从预处理后的手写输入汉字中提取汉字的特征向量;第④步,将汉字的特征向量通过组合分类器与模型汉字进行对比识别,并确定匹配的候选汉字;其特征在于在所述的第②步中的预处理中增加离群点剔除处理,使所述的第②步的具体步骤为:第②‑1步,对采集到的手写输入汉字的笔段进行平滑滤波、噪声剔除和重采样处理;第②‑2步,对经过第②‑1步处理后得到的手写输入汉字的笔段进行数据线性归一化处理;第②‑3步,对数据线性归一化处理后得到的手写输入汉字进行离群点剔除处理,所述的离群点为偏离所述的手写输入汉字的笔段大于设定的阈值的点;所述的第③步中的汉字的特征向量包括笔段特征向量和整字特征向量,所述的笔段特征向量的提取的具体步骤如下:第③‑1步,建立基本笔段类型及与基本笔段类型相对应的参数特征,所述的基本笔段类型包括横、竖、撇、捺、提、勾和点,所述的参数特征包括采样点的时间间隔、笔段方向和笔段长度;第③‑2步,提取预处理后的手写输入汉字的笔段;第③‑3步,根据提取的手写输入汉字的笔段与笔段的连接状态建立前后笔段的连接关系,所述的连接关系包括相连、相交和相离;再根据手写输入汉字的笔段的类型和前后笔段的连接关系去除部分无效笔段;所述的相连包括前笔段起点与后笔段起点相连、前笔段起点与后笔段终点相连、前笔段终点与后笔段起点相连、前笔段终点与后笔段终点相连、前笔段中间点与后笔段起点相连、前笔段起点与后笔段中间点相连、前笔段终点与后笔段中间点相连和前笔段中间点与后笔段终点相连;所述的相交包括中间点与中间点相交;所述的相离包括相邻笔段之间的相离和实际相连书写相离;第③‑4步,根据提取的手写输入汉字的笔段,判断笔段是否有违反书写方法,如果违反了书写方法,则自动删除该笔段,否则,对该笔段不作处理;所述的整字特征向量的提取的具体步骤如下:将手写输入汉字的各笔段端点相连后求取Freeman链码,将Freeman链码确定为一组观测序列。
地址 315010 浙江省宁波市科技园区沧海路75号C座