发明名称 文字辨识方法及装置
摘要 本案系一种文字辨识方法及装置,该辨识方法系一EDLC(Edge Direction Length Contribution )辨识方法,包括:(a)求取一已具笔画宽度之文字之特征点;(b)计算该文字特征点之特征值;(c)依该些特征点数目进行影像区域非均匀分割,俾每一被分割区所包括之特征点数为相同;(d)重覆步骤(a)、(b)至少一次;(e)比较该输入文字特征点之特征值与预存于资料库中之标准文字特征值间之误差值,俾将该输入文字对应至少一标准候选文字,而得辨识结果;另本案亦包括一辅助文字辨识方法,俾对该辨识结果进行详细辨识,而得更正确之辨识结果,该辅助文字辨识方法包括:判别该输入文字与其所对应之该至少一候选字是否应被送至下列之步骤做进一步之辨识;以匈牙利比对方法(Hungarian Matching)调整该输入文字之笔划与该至少一候选字之笔划之对应关系;以动态比对方法(Dynamicprogramming matching)辨识出该输入文字系属该标准候选文字中之合者;该装置包括:一EDLC(Edge Direction LengthContribution)辨识器,其计算所输入文字之特征值,并依该特征值从预存之标准文字特征值中选择至少一候选字与该所输入之文字对应,而得一辨识结果;详细识别判别器,其判别应将那几个候选字送至轮助辨识装置中进行详细辨识;一匈牙利文字辨识器,其依匈牙利文字辨识方法对该输入文字与该被选择之候选字进行文字笔段对应重排;一动态文字比对辨识器,其接收经匈牙利文字辨识器重排对应笔段后之该输入文字及该被选择之候选字,而进行动态文字比对,俾找出该输入文字所对应之最佳候选字;俾得一较精确、无笔顺限制及可连笔划之文字辨识方法及装置。
申请公布号 TW279217 申请公布日期 1996.06.21
申请号 TW083108358 申请日期 1994.09.07
申请人 财团法人工业技术研究院 发明人 林咏顺;屠乐梃;郑仁杰;龚世杰
分类号 G06F15/62 主分类号 G06F15/62
代理机构 代理人
主权项 1. 一种文字辨识方法,其系一EDLC(Edge DirectionLength Contribution)辨识方法,包括:(a) 求取一已具笔画宽度之文字之特征点;(b) 计算该文字特征点之特征値;(c) 依该些特征点数目进行影像区域非均匀分割,俾每一被分割区所包括之特征点数为相同;(c) 重覆步骤(a)、(b)至少一次;(d) 比较该输入文字特征点之特征値与预存于资料库中之标准文字特征値间之误差値,俾将该输入文字对应至少一标准候选文字,而得辨识结果。2. 如申请专利范围第1项所述之文字辨识方法,于步骤(a)之前更包括下列步骤:(f) 接收所输入之文字轨迹点;(g) 疏化该文字轨迹点;(h) 将该轨迹点间之位置以内插法连点成线,俾得该输入文字之文字骨干;(I) 对该文字骨干进行第一图罩运算,俾使该文字骨干具有宽度。3. 如申请专利范围第2项所述之文字辨识方法,步骤(I)中之第一图罩运算所使用之矩阵为,其中,二値化影像在﹡之値为1。4. 如申请专利范围第3项所述之文字辨识方法,步骤(a)包括下列步骤:a1)以二个33之矩阵对影像区域进行第二图罩运算;a2)取运算结果不为0之影像点为特征点。5. 如申请专利范围第4项所述之文字辨识方法,步骤(a1)中第二图罩运算之二个33矩阵系指6. 如申请专利范围第5项所述之文字辨识方法,步骤(b)中之徵値包括长度特征値及方向特征値。7. 如申请专利范围第6项所述之文字辨识方法,步骤(b)中之特征値系分别以该二矩阵第2列第2行之元素罩于被运算之影像点,再以矩阵内各元素与被罩于矩阵下之影像値相乘后再相加得二长度线値X@ssL、Y@ssL,而该长度特征値=[X@ssL@su2+Y@ssL@su2]@su1@su/@su2;该方向特征値=tan@su-@su1Y@ssL/X@ssL。8. 如申请专利范围第7项所述之文字辨识方法,步骤(d)之后更包括二步骤:(J) 将每一特征点之方向特征値依角度大小分为8个方向,再分别将相同方向之长度特征値相加;(K) 将各方向之累积特征値正规化。9. 一种辅助申请专利范围第1项之方法之辅助文字辨识方法,包括:(L) 判别该输入文字与其所对应之该至少一候选字是否应被送至下列之步骤做进一步之辨识;(M) 以匈牙利比对方法(Hungarian matching)调整该输入文字之笔划与该至少一候选字之笔划之对应关系;(N) 以动态比对方法(Dynamic programmingmatching)辨识出该输入文字系属该标准候选文字中之何者。10. 如申请专利范围第9项所述之辅助文字辨识方法,步骤(L)包括下列步骤:L1)选择符合不等式(Di-D1)*Factor 1>(D1*Factor 2)关系之候选字;其中,Factor 1与Factor 2为常数,Di为第个候选字与该输入文字间之EDLC特征値误差;L2)抽取该被选择之候选字之笔段(segment),并再选择其平均每笔划所包括之笔段数小于一定値者进入步骤(M)、(N)中识别。11. 如申请专利范围第10项所述之辅助文字辨识方法,步骤(L1)中之Factor 1=128,Factor 2=40;步骤(L2)中之定値=2.3。12. 如申请专利范围第9项所述之辅助文字辨识方法,步骤(M)中之匈牙利比对方法中之Hungarian Matching矩阵之每个元素値(cost value)系依下列算式得之:cost value={[min(df@ps6@dn3i1@ps9,9.5@up3,df@ps6@dn3i2@ps9,9.5@up3)+(ddegi/5)]+1/3[min(df@ss(@ssi@ss+@ss1@ss)@ss1,df@ss(@ssi@ss+@ss1@ss)@ss2)+(ddeg@ss(@ssi@ss+@ss1@ss)/5)]}df@ps6@dn3i1@ps9,9.5@up3=[(X@ss1-X@ss1@bs3')@su2+(Y@ss1-Y@ss1@bs3')@su2]@su1@su/@su2[(X@ss2-X@ss2@bs3')@su2+(Y@ss2-Y@ss2@bs3')@su2]@su1@su/@su2df@ps6@dn3i2@ps9,9.5@up3=[(X@ss1-X@ss2@bs3')@su2+(Y@ss1-Y@ss1@bs3')@su2]@su1@su/@su2[(X@ss2-X@ss1@bs3')@su2+(Y@ss2-Y@ss1@bs3')@su2]@su1@su/@su2(X@ss1,Y@ss1)为该输入文字中某一笔段之起点座标;(X@ss2,Y@ss2)为该输入文字中某一笔段之终点座标;(X@ss1@su,,Y@ss1@su,)为对应该输入文字笔段之候选字笔划之起点座标;(X@ss2@su,,Y@ss2@su,)为对应该输入文字笔段之候选字笔划之终点座标;df@ps6@dn3(i+1)1@ps9,9.5@up3为df@ssi@ss1之下一组笔段对应之座标;ddeg为该二笔段之方向差値。13. 如申请专利范围第9项所述之辅助文字辨识方法,步骤(N)中动态比对之递回关系式(Recursion Relation)为D(ij)=min{D(i-1,j)+d@ss1(i,j)D(i-1,j-1)+d@ss2(i,j)D(i,j-1)+d@ss3(i,j)}其中D(i,j)是从s1对应r1到si对应rj之累积距离値;s1,s2,…,si,…,sN为输入字之N个动态特征点;r1,r2,…,ri,…,rM为候选字具M动态特征点;(1i,i,fi)及(1j,j,fj)分别代表在点si和rj上之特征向量,其中1i表长度,i表方向,fi表实虚笔参数;d@ss1(i,j)=1i*[k@ss1+g@ss1(fi)];d@ss3(i,j)=1j*[k@ss3+g@ss3(fj)];其中k@ss1,k@ss3是常数;g@ss1,g@ss3是与实、虚笔画有关之常函数;d@ss2(i,j)=h(i,j)+1i*g@ss1(fi) if fi=0;或h(i,j)+1i*g@ss3(fj) if fi=0上三式中h(i,j)依方向差()大小定义如下:h(i,j)=|li-lj|*V() if ≦2否则h(i,j)=(li+lj)*k@ss2其中k@ss2为常数;V( )为方向差之常函数。14. 如申请专利范围第13项所述之辅助文字辨识方法,步骤(N)中动态比对之总误差値Err(DP)=D(i,j)+Si之length*Wi+Sr之lenghth*Wj其中Si表示输入字中,所有没被对应上之笔段Sr表示候选字中,所有没被对应上之笔段Wi,Wj为惩罚加权値常数。15. 如申请专利范围第14项所述之辅助文字辨识方法,步骤(N)中动态比对最后决定是否要更换候选字之顺序的距离误差Err计算如下:if(seg)(候选字)>seg(输入字))Err=Err(DP)*(1+stk*stk/4)否则Err=Err(DP)*(1+stk/4)其中,Stk=│输入字之笔段数(seg(I))-候选字之笔段数(seg(K))│最后依照Err値之大小来判别是否应调整于EDLC辨识中所选出之候选字顺序,俾得一更正确之辨识结果。16. 一种文字辨识装置及其辅助辨识装置,包括:一EDLC(Edge Direction Length Contribution)辨识器,其计算所输入文字之特征値,并依该特征値从预存之标准文字特征値中选择至少一候选字与该所输入之文字对应,而得一辨识结果;详细识别判别器,其判别应将那几个候选字送至辅助辨识装置中进行详细辨识;一匈牙利文字辨识器,其依匈牙利文字辨识方法对该输入文字与该被选择之候选字进行文字笔段对应重排;一动态文字比对辨识器,其接收经匈牙利文字辨识器重排对应笔段后之该输入文字及该被选择之候选字,而进行动态文字比对,俾找出该输入文字所对应之最佳候选字。17. 如申请专利范围第16项所述之装置,其中该EDLC辨识器包括:一影像处理器,接收所输入文字之影像轨迹点,使该轨迹点具有笔画宽度,并依重覆矩阵图罩运算找出文字特征点;一特征値产生器,产生所输入文字之特征値,并将该特征値正规化;一特征値资料库,预存有标准文字之特征资料;一差値辨识器,依该所输入文字特征値与该标准文字之特征値间之差値大小,选择出至少一个与该所输入文字最接近之标准文字候选字。18. 如申请专利范围第16项所述之装置,该详细识别判别器包括:一差値比较器,选择该候选字中,符合不等式(Di-D1)﹡Factor 1>(D1﹡Factor 2)之候选字;其中,Factor 1与Factor 2为常数,Di为第i个候选字与该输入文字间之特征値误差;一笔段抽取器,抽取符合该不等式之候选字之笔段,并使候选字中平均每笔划之笔段数小于一定値者,可进入匈牙利文字辨识器及动态文字比对辨识器中识别。图示简单说明:第一图:系本案文字辨识方法及其辅助方法之装置方块示意图。第二图:系本案文字辨识方法及其辅助方法之步骤流程示意图。第三图:系本案"乙"字之影像扩张示意图。第四图:系本案方向特征示意图。第五图:系经匈牙利辨识后所得之输入字与候选字之笔段对应图。
地址 新竹县竹东镇中兴路四段一九五号