发明名称 | 一种基于笔矢量特征的联机手写中文词组切分方法 | ||
摘要 | 本发明提供一种基于笔矢量特征的联机手写中文词组切分方法,采用N个笔段构成词组,词组记为W<SUB>N</SUB>={S<SUB>1,</SUB> S<SUB>2,</SUB>S<SUB>3,</SUB>…S<SUB>N</SUB>},每一个笔段由多个点P<SUB>k</SUB>构成,记为S<SUB>i</SUB>={P<SUB>1,</SUB> P<SUB>2,</SUB> P<SUB>3,</SUB>…P<SUB>t</SUB>},而第k个点P<SUB>k</SUB>=(x,y),其中x、y分别为横、纵坐标大小,第i个笔段的起点和终点分别为P<SUB>i</SUB><SUP> b</SUP>和P<SUB>i</SUB><SUP> e</SUP>,定义第i个笔段S<SUB>i</SUB>和第i+1个笔段S<SUB>i+1</SUB>之间的笔矢量特征如下:Vec<SUB>i,i+1</SUB>=Dis(P<SUB>i</SUB><SUP> b</SUP>,P<SUB>i+1</SUB><SUP> b</SUP>),Dis表示计算两个点之间的距离,则词组W<SUB>N</SUB>={S<SUB>1,</SUB> S<SUB>2,</SUB> S<SUB>3,</SUB>…S<SUB>N</SUB>}存在一组笔矢量特征序列如下:V={Vec<SUB>1,2</SUB>,Vec<SUB>2,3</SUB>,Vec<SUB>3,4</SUB>,…Vec<SUB>N-1,N</SUB>},取其中最大的数值所对应的笔段最右点作切分线,将手写词组进行切分。本发明不仅运算复杂度低,而且切分效果较好,提切分候选线的效率高,为联机手写中文词组的切分提供了一种有效的解决方法。 | ||
申请公布号 | CN101320428A | 申请公布日期 | 2008.12.10 |
申请号 | CN200810029421.1 | 申请日期 | 2008.07.11 |
申请人 | 华南理工大学 | 发明人 | 金连文;郭锐 |
分类号 | G06K9/20(2006.01);G06K9/46(2006.01) | 主分类号 | G06K9/20(2006.01) |
代理机构 | 广州粤高专利代理有限公司 | 代理人 | 何淑珍 |
主权项 | 1、一种基于笔矢量特征的联机手写中文词组切分方法,其特征在于采用N个笔段构成词组,词组记为WN={S1,S2,S3,...SN},每一个笔段由多个点Pk构成,记为Si={P1,P2,P3,...Pt},而第k个点Pk=(x,y),其中x、y分别为横、纵坐标大小,第i个笔段的起点和终点分别为Pib和Pie,定义第i个笔段Si和第i+1个笔段Si+1之间的笔矢量特征如下:<math><mrow><msub><mi>Vec</mi><mrow><mi>i</mi><mo>,</mo><mi>i</mi><mo>+</mo><mn>1</mn></mrow></msub><mo>=</mo><mi>Dis</mi><mrow><mo>(</mo><msup><msub><mi>P</mi><mi>i</mi></msub><mi>b</mi></msup><mo>,</mo><msup><msub><mi>P</mi><mrow><mi>i</mi><mo>+</mo><mn>1</mn></mrow></msub><mi>b</mi></msup><mo>)</mo></mrow><mo>,</mo></mrow>组WN={S1,S2,S3,...SN}存在一组笔矢量特征序列如下:V={Vec1,2,Vec2,3,Vec3,4,...VecN-1,N}取其中最大的数值所对应的笔段最右点作切分线,将手写词组进行切分。 | ||
地址 | 510640广东省广州市天河区五山路381号 |