发明名称 一种字母大小写判断方法
摘要 本发明提供了一种字母大小写判断方法,属于光学字符识别领域,该方法包括:获取单词中的字母在图像中的位置;根据通过字符书写规范预先定义的字母基线类型和字母在图像中的位置获得单词的基线属性,根据单词的基线属性判断字母的大小写;输出完成字母大小写判断的字符识别结果。本方法大大提高字母大小写判断的正确率,从而提高印刷文档识别的识别率;并且只要某种语言中的字母具有四线格书写规范,则就可用于该种语言文档中的字母大小写判断,具有很好的通用性及适应性。
申请公布号 CN101807255B 申请公布日期 2011.11.30
申请号 CN200910077745.7 申请日期 2009.02.16
申请人 汉王科技股份有限公司 发明人 肖潇;刘正珍
分类号 G06K9/62(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 代理人
主权项 一种字母大小写判断方法,其特征在于,包括步骤:步骤I:获取单词中的字母在图像中的位置;步骤II:根据通过字符书写规范预先定义的字母基线类型和字母在图像中的位置获得单词的基线属性,根据单词的基线属性判断单词中字母的大小写;包括:根据字符集中所有字母在四线格中的位置确定字母基线类型;判断是否能够通过单词中具有唯一基线类型的字母和字母在图像中的位置计算单词的基线属性,如果是,则计算单词的基线属性,根据单词的基线属性判断字母的大小写;如果否,则进入下一步;依次选取单词中的每个字母和其他字母两两进行判断,利用两个字母在图像上的位置关系,并结合字母的基线类型属性判断在满足此位置关系的情况下两个字母属于的基线类型组合,若仅存在一个满足此位置关系的基线类型组合,既确定两个字母在此单词中所属的基线类型属性,也即确定了两个字母的大小写属性,从而判断是否能够通过单词中字母相对位置关系以及字母基线类型计算单词的基线属性;如果是,则计算单词的基线属性,根据单词的基线属性判断字母的大小写,否则利用邻近单词的基线属性对当前单词中字母进行大小写判断;所述单词基线属性即四线格在单词中的位置,将单词分为具有基线0、基线1、基线2、基线3四种基线属性;步骤III:对单词中字母的原识别结果进行修正,输出字符识别结果。
地址 100193 北京市海淀区东北旺西路8号5号楼三层