发明名称 文本图像的校正方法
摘要 本发明文本图像的校正方法,属于光学字符识别领域,包括以下步骤:定位文本图像中的字符区域并提取疑似字符;对疑似字符进行识别,若识别可信度大于单个字符可信度参考值,则字符有效方向为正向,否则将疑似字符分别逆时针旋转来判断有效方向;提取具有有效方向的字符至有效字符集,直到某方向识别可信度累加值高于既定的识别可信度,则提取对应的文本方向;校正图像的方向,进行文本图像的识别并输出。本方法有效滤除了不可靠的字符的影响,避免文字区域中的不可靠的区域对文字方向判断的影响。对于复杂文本图像、含有噪声的文本图像、质量较差的文本图像具有较好的自适应,能较快、正确的判断出文本图像方向,进而有效地进行文本图像的识别。
申请公布号 CN101833648A 申请公布日期 2010.09.15
申请号 CN200910079865.0 申请日期 2009.03.13
申请人 汉王科技股份有限公司 发明人 万鑫;刘正珍
分类号 G06K9/00(2006.01)I;G06K9/46(2006.01)I 主分类号 G06K9/00(2006.01)I
代理机构 代理人
主权项 一种文本图像的校正方法,其特征在于,包括以下步骤:步骤一:定位文本图像中的字符区域;步骤二:对字符区域中的字符块进行基于结构特征的分类,并从中提取疑似字符;步骤三:用字符识别引擎对提取的疑似字符进行识别;若得到的识别可信度大于单个字符可信度参考值,则字符有效方向为正向,转到步骤四;否则将疑似字符分别逆时针旋转90°、180°、270°进行识别,若各方向的识别可信度仅有一个大于单个字符可信度参考值,则对应的方向为该字符的有效方向,转到步骤四;否则转到步骤二;步骤四:逐个提取具有有效方向的字符至有效字符集,计算其中各字符的四个方向上的识别可信度累加值,直到某方向识别可信度累加值高于既定的识别可信度;将该累加值对应的方向作为文本方向;步骤五:根据文本方向判断结果,校正图像的方向,进行文本图像的识别并输出。
地址 100193 北京市海淀区东北旺西路8号5号楼三层