发明名称 一笔顺及笔画数自由之线上手写中文字辨认方法与装置
摘要 本发明提出一个笔顺笔画数自由之线上手写中文字辨识法,其所包含之步骤有:(a)以线上之方式利用数位板输入手写文字;(b)对输入文字做前处理,以撷取特征点,进而求取输入笔画之线段逼近表示法;(c)利用基本笔画资料库,辨认出包含于输入字之所有可能的基本笔画;(d)执行大分类以降低比对之候选参考字之字数;(e)利用笔画对应规则资料库,以求得输入字与参考字之笔画对应关系;(f)使用字形图样资料库及文字笔画空间关系资料库,执行文字监别函数之计算,以寻找出具有最小距离值之参考字为辨识结果。本发明方法之关键特点有:(a)笔画对应中,笔画可以被判定为三种类别:"前笔画","后笔画"及"点"。"前笔画"为实际出现于文字中之笔画;"后笔画"则是连接两相邻"前笔画"之虚构笔画。当连笔发生时,"后笔画"可能会出现为"明笔画"或是退化为一"点"。(b)每一个笔画对应规则所包含之笔画相关资讯有:(i)所允许出现之基本笔画形态,(ii)至少一个相关的笔画几何特征及(iii)比对时,运用几何特征之准则;笔画几何特征便是与笔画相关之一些几何特征测度,有笔画特征之x,y座标,笔画长度及一些相关之特征点到一些参考点之距离。这些笔画特征,可使笔画对应能顺利完成。在本发明之实施例中,可有八种可能型态之笔画对应:(1)前笔画→前笔画,(2)后笔画→后笔画,(3)后笔画→前笔画,(4)后笔画→点,(5)后笔画→空笔画,(6)空笔画→后笔画,(7)前笔画→空笔画,及(8)空笔画→前笔画。
申请公布号 TW337010 申请公布日期 1998.07.21
申请号 TW085112683 申请日期 1996.10.15
申请人 财团法人工业技术研究院 发明人 李素瑛;陈如薇
分类号 G06F17/20 主分类号 G06F17/20
代理机构 代理人
主权项 1.一种笔顺及笔画数自由之线上手写中文字辨认方法,包含:(a)参考样版字之笔画对应规则资料库,每一字种用一组笔画对应规则,来描述其构字之基本笔画特征,以构成笔画对应规则资料库;(b)文字之笔画空间关系资料库;(c)文字图样资料库;(d)以线上之方式由数位板输入文字;(e)将输入字做前处理,以求得输入笔画特征点,并利这些特征点之连线,来逼近表示输入笔画;(f)利用基本笔画资料库,辨认出包含于输入字之所有可能基本笔画;(g)大分类利用输入字笔画估测范围及字形统计特征来选出候选参考字;(h)将笔画分成"前笔画","后笔画"及"点",其中前笔画为实际出现于文字中之笔画;"后笔画"是连接两相邻之"前笔画"之虚构笔画,当连笔发生时,其可能会出现为"明笔画",或退化为一"点";(i)当一个侯选参考字与输入字比对时,以该候选字之笔画对应规则,求取它们的笔画对应关系,其中每一规则会被使用过,直到所有规则均被使用过为止,藉此可以判断出所有"前笔画→前笔画"之对应关系;(j)依循输入字之笔顺,检验型态为"前笔画→前笔画"之笔画对应,可藉以求得其他型态之笔画对应,包括"后笔画→点","后笔画→前笔画","前笔画→空笔画","空笔画→前笔画","后笔画→空笔画","空笔画→后笔画"等;及(k)执行监别函数之运算,以求得具有最小距离値之候选参考字,做为辨识结果。2.如申请专利范围第1项所述之笔顺及笔画数自由之线上手写中文字辨认方法,进一步包含将输入字之笔顺依参考字之笔顺做重排之步骤,以使用参考字库中之笔画空间关系资讯来监别文字,以及将参考字之笔顺依输入字笔顺做重排,并利用"前笔画→前笔画"之对应,以求得其他型态之笔画对应。3.如申请专利范围第1项所述之笔顺及笔画数自由之线上手写中文字辨认方法,其中之"笔画对应规则",包含:(a)输入笔画所允许发生之基本笔画形态;(b)至少一种以上相关于该笔画之不变"笔画几何特征";以及(c)笔画几何特征之运用方式。4.如申请专利范围第3项所述之笔顺及笔画数自由之线上手写中文字辨认方法,其中之"笔画几何特征"为笔画特征点之x,y座标,笔画长度,及一些相关之特征点到一些参考点之距离。5.如申请专利范围第1项所述之笔顺及笔画数自由之线上手写中文字辨认方法,其中之笔画对应型态有:(1)前笔画→前笔画;(2)后笔画→后笔画;(3)后笔画→前笔画;(4)后笔画→点;(5)后笔画→空笔画;(6)空笔画→后笔画;(7)前笔画→空笔画;及(8)空笔画→前笔画。6.如申请专利范围第1项所述之笔顺及笔画数自由之线上手写中文字辨认方法,其中所用到之文字之笔画空间关系,是利用四个向量:ss(i,i+1),se(i,i+1),es(i,i+1),及ee(i,i+1)来表示相邻笔画i及i+1笔画空间关系,其中之向量分别由笔画i之起始点及终止点到笔画i+1之起始点及终止点所构成。7.一种笔顺及笔画数自由之线上手写中文字辨识装置,包含:(a)参考样版字之笔画对应规则资料储存记忆体,每一个参考样版字用一组笔画对应规则来描述其构字之基笔画特征;(b)文字笔画空间关系资料库之储存记忆体;(c)文字图样资料库之储存记忆体;(d)以线上之方式由数位板输入文字;(e)将输入字做前处理,以求得输入笔画之特征点,并利用这些特征点之连线,来近似表示输入笔画;(f)使用基本笔画资料库,辨认出包含于输入字之所有可能基本笔画;(g)以大分类来降低候选字数之方法,其所使用之大分类特征有:输入字笔画数估测范围及字形统计特征;(h)将笔画概分成"前笔画","后笔画"及"点"三类,"前笔画",为实际出现于文字中之笔画;"后笔画"则是连接两相邻"前笔画"之虚构笔画,当连笔发生时,"后笔画"可能会出现为"明笔画",或是退化为一"点";(i)执行笔画对应,当一个候选参考字与输入字比对时,则必须用该候选字之笔画对应规则,来求它们的笔画对应关系,其中每一个规则均会被使用过,直到用完为止,藉此可以判断出所有"前笔画→前笔画"之对应关系;(j)执行其他型态之笔画配对,即依循输入字之笔顺,检验型态为"前笔画→前笔画"之笔画对应,藉此可求得其他型态之笔画对应,包括"后笔画→点","后笔画→前笔画","前笔画→空笔画","空笔画→前笔画","后笔画→空笔画",及"空笔画→后笔画"等;以及(k)执行监别函数之运算,以求得具有最小距离値之候选参考字,做为辨识结果。8.如申请专利范围第7项所述之笔顺及笔画数自由之线上手写中文字辨认装置,其中进一步可包含:将输入字之笔顺依参考字之笔顺做重排之步骤,以使用参考字库中之笔画空间关系资讯来监别文字;并依参考字之笔顺将输入字笔顺做重排,并且利用"前笔画→前笔画"之对应,求得其他型态之笔画对应。9.如申请专利范围第7项所述之笔顺及笔画数自由之线上手写中文字辨识装置,其中之每个笔画对应规则,包含:(a)手写笔画所允许发生之基本笔画形态;(b)至少一个以上相关于该笔画之"笔画几何特征";以及(c)笔画特征之运用方式。10.如申请专利范围第9项所述之笔顺及笔画数自由之线上手写中文字辨识装置,其中之"笔画几何特征"而笔画特征点之x,y座标,笔画长度,及一些相关特征点到一些参考点之距离。11.如申请专利范围第7项所述之笔顺及笔画数自由之线上手写中文字辨识装置,其中之笔画对应型态有:(1)前笔画→前笔画;(2)后笔画→后笔画;(3)后笔画→前笔画;(4)后笔画→点;(5)后笔画→空笔画;(6)空笔画→后笔画;(7)前笔画→空笔画;及(8)空笔画→前笔画。12.如申请专利范围第7项所述之笔顺及笔画数自由之线上手写中文字辨认识装置,其中文字笔画空间关系,是利用向量:ss(i,+1),se(i,+1),es(i,+1),及ee(i,+1)来表示相邻笔画i及i+1之笔画空间关系,其中之向量,分别由笔画i之起始点及终止点到笔画i+1之起始点及终止点所构成。图式简单说明:第一图是实施例中之辨识架构图。第二图(a)-第二图(c)是"王"字之标准字形及两个草写字形中所有可能之基本笔画。第三图(a)-第三图(c)是第二图(a)-第二图(c)中之例子,使用笔画对应规则之过程。第四图是文字最小包围矩形上之8个参考点,而笔画几何特征编号11至24,便是由此8个参考点定义定出来的。第五图a及第五图b分别是图示"羽"字,及表列"羽"字之笔画对应规则。第六图则是描绘两明笔画i及i+1之笔画空间关系,以四个向量ss(i,i+1),se(i,i+1),es(i,i+1),及ee(i,i+1)来表示,其是由笔画i之起始点(s)至终止点(e)至笔画i+1之起始点(s)及终止点(e)所构成。
地址 新竹县竹东镇中兴路四段一九五号