发明名称 一种基于分类模糊及图像分割的英文字符识别方法
摘要 本发明提供一种基于分类模糊及图像分割的英文字符识别方法。当一个个子窗口完整地、理想地分割出一个独立字符时,该个子窗的最后一列或最后一行应为背景区域,分离置信度等于或接近最大值1;当个子窗口没有完整分割出一个独立字符时,该个子窗的最后一列或最后一行会包含有字符区域,使得分离置信度降低。完整分割出一个独立字符的子窗口的窗口分数将远大于其他尺寸的子窗口的窗口分数。本发明通过引入了分离置信度对滑动窗结果进行分数计算就能有效的抑制大量干扰的子窗口,提高识别正确率。本发明将形状相似的大写字母、小写字母以及数字进行合并分类,之后通过常用英文字母组合规则进行2次判断,进一步能提高相似形状字符的识别正确率。
申请公布号 CN103455823A 申请公布日期 2013.12.18
申请号 CN201310376411.6 申请日期 2013.08.27
申请人 电子科技大学 发明人 李宏亮;黄敏;姚卫;黄自力;孟凡满;黄超;吴庆波
分类号 G06K9/62(2006.01)I;G06K9/46(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 电子科技大学专利中心 51203 代理人 邹裕蓉
主权项 1.一种基于分类模糊及图像分割的英文字符识别方法,其特征在于,包括以下步骤:第1步:利用输入的含有一行或一列待识别英文字符串的图像生成二值掩模,属于字母的像素点的掩模值为1,属于背景的像素点的掩模值为0;第2步:使用滑动窗对图像取大小不同的子窗口;对于英文字母水平排列的英文字符串,子窗口的行数为输入待识别字符串总行数,子窗口的行数逐渐增长,子窗口的列的起点位置逐渐向右移动;对于英文字母垂直排列的英文字符串,子窗口的列数为输入待识别字符串总列数,子窗口的行数逐渐增长,子窗口的行的起点位置逐渐向下移动;第3步:各根据子窗口二值掩模计算子窗口的分离置信度SC:<img file="FDA0000372373810000011.GIF" wi="245" he="83" />其中,ω为权值,对于英文字母水平排列的英文字符串,n<sub>o</sub>为子窗口最后一列对应的掩模值为1的像素总数,n为子窗口最后一列上像素总数量;对于英文字母垂直排列的英文字符串,n<sub>o</sub>为子窗口最后一行对应的掩模值为1的像素总数,n为子窗口最后一行上像素总数量;第4步:对子窗口提取特征并使用字母分类器分类,字母分类器输出子窗口对应的分类结果和分类分数;所述字母分类器类别包括普通字母类别与模糊字母类别,所述普通字母类别仅包括一个大写字母、小写字母或者数字类别;所述每一个模糊字母类别包括1类的形状相似的大写字母类别以及小写字母类别,或者,1类形状相似的大写字母类别、小写字母类别以及数字类别;第5步:计算每个子窗口得分,子窗口得分为子窗口对应的分离置信度与分类分数之积;第6步:将所有已输出分类结果的子窗口以字母排列方向链接成多条单向路径,两个子窗口链接条件为:一个子窗口在字母排列方向上的结束点与另一个子窗口在字母排列方向上的起点位置偏移在预设最小范围内。第7步:计算各单向路径的路径分数,通过对该单向路径对应的所有链接子窗口的子窗口得分进行乘积,再对乘积结果开n次方,n为该单向路径对应的所有链接子窗口总数,开方结果为该单向路径的路径分数;第8步:将路径分数最高的单向路径作为结果路径输出;第9步:判断结果路径的子窗口分类情况,是否存在模糊类,如否,则直接依次输出结果路径上子窗口对应的识别字符串;如是,则根据模糊类子窗口对应的2个或2个以上可能分类结果,依次输出结果路径上子窗口对应的可能的字符串组合,再根据常用英文字母组合规则选出最合理的作为最终的识别字符串。
地址 611731 四川省成都市高新区(西区)西源大道2006号