发明名称 用于辨认手写字元之方法及装置
摘要 一种方法,用以辨认手写汉文文字者,包括接收一文字影像大小如IxJ之步骤;便用一种统计方法,计算包含有自输入文字影像之座标有限号数之特征向量之步骤;在一组相当于辨认目标文字之内,找寻最类似于所计算之特征向量之具代表性向量之步骤;获得相当于所找寻具代表性向量之文字以及与此文宇相关联之候选文字群;以及在所获得之候选文字群中输出一文字,作为经由以使用含座标之有限号数,相当于该候选文字群之文字图型之特征向量所造就之神经网络,而产生之最后辨认。其结果,一种装置,用以可靠地辨识完全地自然地手写汉文字者,即可实现。
申请公布号 TW417055 申请公布日期 2001.01.01
申请号 TW084106312 申请日期 1995.06.20
申请人 三星电子股份有限公司 发明人 金寿衡;都鼎仁;金俊镐;李相奎
分类号 G06F17/00;G06F3/02 主分类号 G06F17/00
代理机构 代理人 恽轶群 台北巿南京东路三段二四八号七楼;康伟言 台北巿南京东路三段二四八号七楼
主权项 1.一种用以辨认手写文字之方法,包含之步骤为: 接收一文字影像如IJ之大小; 利用统计方法,计算含有座标之有限号数之特征向 量,作为相当于在该输入文字影像内之图型之一特 征, 其中用以计算该特征向量之步骤所包含之步骤为: (a)划分I行和J列之IJ输入影像成为在垂直方向中 之M条和在水平方向中之N条,藉以产生非线性划分 之NM单元,其中I≧M,J≧N,以及I,J,M和N均系自然数; (b)计算垂直方向分量値FV和水平方向分量値FH之2MN 特征値,以每一划分之单元为准使用下列等式:FV=BV /BP以及FH=BH/BP,其中BP为输入影像内黑色像素之数 量,BV为每一单元内属于垂直方向分量之黑色像素 数量,以及BH为每一单元内属于水平方向分量之黑 色像素数量; (c)藉应用步骤(A)和(B)于已转动45度之输入影像图 型之新2MN特征値;以及 (d)提供以该垂直,水平,对角线为准之4MN特征値,作 为输入文字图型之特征向量; 在此组相当于辨认标的文字之代表性向量中,找寻 极类似于该计算之特征向量之一代表性向量; 获得相当于该寻得之代表性向量之一文字,以及与 此文字相关联之候选文字群;以及 在所获得之候选文字群中输出一文字,作为经由以 使用含座标之有限号数,相当于该候选文字群之文 字图型之特征向量所造就之神经网络而产生之最 后辨认。2.如申请专利范围第1项之用以辨认手写 文字之方法,其中该垂直和水平方向分量系含有运 行之运行组,其长度系较垂直和水平方向内黑色像 素之运行中之阈値T为大。3.如申请专利范围第2项 之用以辨认手写文字之方法,其中该阈値T系依据W 之因数,以动作特性而获得,其中W为要予辨认之文 字之笔画厚度。4.如申请专利范围第3项之用以辨 认手写文字之方法,其中该文字笔画厚度W系计算 为W=BP/(BP-WP),其中BP为输入影像内黑色像素之数量, 以及WP为黑色像素之数量其三个接邻像素在一22 窗口内与此像素呈直线对准者亦系黑色。5.如申 请专利范围第1项之用以辨认手写文字之方法,其 中该候选文字群系藉下列步骤而建立: 收集有关误认文字Ci之资料,这些系作为文字Ci而 被误认,这些误认是因为Ci之特征向量和Ci之代表 性向量之间之距离系较Cj之特征向量和Cj之代表性 向量之间之距离为小; 以频率之顺序配置这些误认之文字;以及 在此误认文字中确定某些较高排序之文字,作为Ci 之候选文字群。6.一种用以辨认手写文字之方法, 包含之步骤为: 接收一文字影像如IJ之大小; 利用统计方法,计算含有座标之有限号数之特征向 量,作为相当于在该输入文字影像内之图型之一特 征, 在此组相当于辨认标的文字之代表性向量中,找寻 极类似于该计算之特征向量之一代表性向量; 获得相当于该寻得之代表性向量之一文字,以及与 此文字相关联之候选文字群;以及 在所获得之候选文字群中输出一文字,作为经由以 使用含座标之有限号数,相当于该候选文字群之文 字图型之特征向量所造就之神经网络而产生之最 后辨认, 其中用以运算神经网络之输出之特征向量系由下 列步骤来计算: (a)非线性地划分此文字影像成为NM单元于水平向 或垂直向方向中; (b)获得传送通过黑色像素Px,y之水平和垂直运行之 长度RLHx,y和RLVx,y,其中,0≦x≦W以及0≦y≦H,其中W为 文字影像之宽度,以及H为文字影像之高度; (c)在Px,y处使用下列公式获得水平和垂直方式中所 促成之度数,此等度数即为DCHx,y和DCVx,y: (d)以非线性划分之NM单元内现存所有黑色像素为 准,自DCHx,y和DCVx,y之平均値计算2(NM)大小之特征向 量;以及 (e)以应用(a)至(d)之步骤于白色像素来计算2(NM)大 小之特征向量,藉以获得4(NM)大小之特征向量。7. 一种用以辨认手写文字之装置,包含: 一输入部分,用以将一手写文件影像数据化而成为 二値图像; 一预先处理部分,用以将二输入之二値图像片段化 ,一字一单元地输出; 一候选文字群记忆器,用以贮存此候选文字群,每 一群各代表每一辨认标的文字,并被视为包括此辨 认标的文字之若干候选文字; 一代表性向量记忆器,用以贮存相当于所有辨认标 的文字之特征向量; 一概略分类部分,用以获得经由该预先处理部分输 入之文字图型之特征向量,用以找寻代表性向量之 极类似于自代表性向量记忆器之所获得之特征向 量者,并自候选文字群记忆器,用以找寻相当于所 寻得之代表性向量之辨认标的文字,以及含有此辨 认标的文字之相关联之候选文字群; 一神经网络记忆器包含所有神经网络,每一神经网 络系为贮存在候选文字群记忆器内之每一候选文 字群,以及 一详细分类部分,用以经由贮存于神经网络记忆器 内之相当神经网络,自概略分类部分内所寻得之候 选文字群,辨认一文字,并用以应用一控制信号至 该预先处理部分,以提供下一个要予辨认之文字, 直到输入文件影像内所有之文字均已辨认为止。 图式简单说明: 第一图为依据本发明之一手写文字辨认系统之方 块图; 第二图A至第二图C系线图,用以说明自输入文字影 像之特征之提取,在第一图之概略分类部分中实施 者; 第三图为一线图,说明辨认标的文字之候选文字群 之建立,由第一图之概略分类部分和详细分类部分 来指示; 第四图为一线图,用以说明自输入文字影像之水平 向和垂直向特征之提取,此将在详细分类部分中实 施; 第五图为一线图,用以说明神经网路记忆器内神经 网络之构造;以及 第六图为一线图,显示依据本发明之较佳实施例之 手写文字辨认之结果之一范例。
地址 韩国