发明名称 一种基于笔矢量特征的联机手写中文词组切分方法
摘要 本发明提供一种基于笔矢量特征的联机手写中文词组切分方法,采用N个笔段构成词组,词组记为W<SUB>N</SUB>={S<SUB>1,</SUB> S<SUB>2,</SUB>S<SUB>3,</SUB>…S<SUB>N</SUB>},每一个笔段由多个点P<SUB>k</SUB>构成,记为S<SUB>i</SUB>={P<SUB>1,</SUB> P<SUB>2,</SUB> P<SUB>3,</SUB>…P<SUB>t</SUB>},而第k个点P<SUB>k</SUB>=(x,y),其中x、y分别为横、纵坐标大小,第i个笔段的起点和终点分别为P<SUB>i</SUB><SUP> b</SUP>和P<SUB>i</SUB><SUP> e</SUP>,定义第i个笔段S<SUB>i</SUB>和第i+1个笔段S<SUB>i+1</SUB>之间的笔矢量特征如下:Vec<SUB>i,i+1</SUB>=Dis(P<SUB>i</SUB><SUP> b</SUP>,P<SUB>i+1</SUB><SUP> b</SUP>),Dis表示计算两个点之间的距离,则词组W<SUB>N</SUB>={S<SUB>1,</SUB> S<SUB>2,</SUB> S<SUB>3,</SUB>…S<SUB>N</SUB>}存在一组笔矢量特征序列如下:V={Vec<SUB>1,2</SUB>,Vec<SUB>2,3</SUB>,Vec<SUB>3,4</SUB>,…Vec<SUB>N-1,N</SUB>},取其中最大的数值所对应的笔段最右点作切分线,将手写词组进行切分。本发明不仅运算复杂度低,而且切分效果较好,提切分候选线的效率高,为联机手写中文词组的切分提供了一种有效的解决方法。
申请公布号 CN101320428A 申请公布日期 2008.12.10
申请号 CN200810029421.1 申请日期 2008.07.11
申请人 华南理工大学 发明人 金连文;郭锐
分类号 G06K9/20(2006.01);G06K9/46(2006.01) 主分类号 G06K9/20(2006.01)
代理机构 广州粤高专利代理有限公司 代理人 何淑珍
主权项 1、一种基于笔矢量特征的联机手写中文词组切分方法,其特征在于采用N个笔段构成词组,词组记为WN={S1,S2,S3,...SN},每一个笔段由多个点Pk构成,记为Si={P1,P2,P3,...Pt},而第k个点Pk=(x,y),其中x、y分别为横、纵坐标大小,第i个笔段的起点和终点分别为Pib和Pie,定义第i个笔段Si和第i+1个笔段Si+1之间的笔矢量特征如下:<math><mrow><msub><mi>Vec</mi><mrow><mi>i</mi><mo>,</mo><mi>i</mi><mo>+</mo><mn>1</mn></mrow></msub><mo>=</mo><mi>Dis</mi><mrow><mo>(</mo><msup><msub><mi>P</mi><mi>i</mi></msub><mi>b</mi></msup><mo>,</mo><msup><msub><mi>P</mi><mrow><mi>i</mi><mo>+</mo><mn>1</mn></mrow></msub><mi>b</mi></msup><mo>)</mo></mrow><mo>,</mo></mrow>组WN={S1,S2,S3,...SN}存在一组笔矢量特征序列如下:V={Vec1,2,Vec2,3,Vec3,4,...VecN-1,N}取其中最大的数值所对应的笔段最右点作切分线,将手写词组进行切分。
地址 510640广东省广州市天河区五山路381号