发明名称 文字信息图形编码-机器文字及其自动识别方法
摘要 本发明是一种文字信息图形编码及其自动识别方法。这种文字信息图形编码又称为机器文字,是为机器自动识别世界上各种文字信息而发明的。现在人们使用的文字,机器自动识别时正确率低,速度慢,可靠性差,可识别的文字数量也有限。使用机器文字,则不仅识别的速度非常快,识别的文字数量几乎可包容世界上所有的文字,而且能达到100%的正确识别率。机器文字适用于多文种文字信息的印刷保存、处理及交换,由于它的编码密度和编码空间远远大于条码,因此有着比条码更加广泛的应用领域和经济效益。机器文字的出现,是人类文字发展的一个新纪元。机器文字为社会提供了一种新的文字记载方法及自动识别方法,它的字形规范和标准,识别速度快、可靠性好和成本低,将会引起信息社会发生一场革命。机器文字将改变出版、物资流动、人才流动、工业生产、办公自动化等领域的面貌,也将促进机器人快速发展。
申请公布号 CN1108583C 申请公布日期 2003.05.14
申请号 CN97116353.7 申请日期 1997.08.18
申请人 郭熙凡 发明人 郭熙凡
分类号 G06K9/18 主分类号 G06K9/18
代理机构 代理人
主权项 1.一种文字信息图形编码——机器文字及其自动识别方法,其特征在于:①该文字信息图形编码有一个形如Z的固定组成部分,确定了每个文字编码图形占有的相同的矩形区域,设矩形区域的宽为w,高为h,从矩形的左上角点向下,是一垂直线段,长度等于h的三分之二,称为左边线,从矩形的左上角点向右,是一水平线段,长度等于w的三分之二,称为上边线,从矩形的右下角点向上,是一垂直线段,长度等于h的三分之一,称为右边线,从矩形的右下角点向左,是一水平线段,长度等于w的三分之二,称为下边线,从上边线的右端点向下是一垂直线段,长度等于h的二分之一,称为右分界线,从下边线的左端点向上是一垂直线段,长度等于h的二分之一,称为左分界线,连接左分界线上端点和右分界线下端点的线段,是一水平线段,长度等于w的三分之一,称为水平分界线,左边线、上边线、右分界线、水平分界线、左分界线、下边线、和右边线组成文字信息图形编码的骨架,是文字信息图形编码的固定组成部分;文字信息图形编码由骨架和在骨架特定位置上的笔画组成,Z型骨架的右分界线、水平分界线和左分界线将编码图形分为左区和右区两部分,同时根据骨架的高和宽把左区和右区分别分为8个子区域,这些子区域由骨架而确定,相对于骨架是固定的,是骨架的特定位置,长度都等于w的三分之一,文字信息图形编码遵循以下编码规则:将左区的8个子区域分别和一个字节的8个BIT位一一对应,如果某一BIT位为1,它所对应的子区域有笔画,为0它所对应的子区域则无笔画,同样右区的8个子区域也分别和一个字节的8个BIT位一一对应,这样,对于一个定义为二字节的文字,用左区表示文字的第一个字节,用右区表示文字的第二个字节,骨架和笔画就组成了该文字的图形编码;文字信息图形编码的骨架的边线长短确定了文字编码图形的上下左右方位;②文字信息图形编码机器自动识别时只要判别出各笔画及其相对于骨架的位置,即可得到其文字信息。
地址 100053北京市宣武区槐柏树街北里6楼2门403号
您可能感兴趣的专利