发明名称 |
一种文字识别方法 |
摘要 |
本发明涉及图像识别技术领域,尤其是涉及一种文字识别方法,包括:获取待识别图像;对已获取图像预处理:图像倾斜校正以校正图像和阈值化处理获得前景信息及背景信息单一的图像;分析处理图像:分析图像的行间纹理特征,获取图像的文字矩阵参数;分割图像:基于所述文字矩阵参数对图像进行切割,形成若干个子图像,获取图像的文字字块;识别:对文字字块进行单独处理,获取文字字块的图像特征,并对所述图像特征进行识别;所述图像校正包括:先对图像进行膨化处理、检测膨化后图像的边缘、对边缘点进行hough变换找到最长线段的角度、得到直线角度并旋转图像角度。该方法文字简单易行,识别率高。 |
申请公布号 |
CN106503711A |
申请公布日期 |
2017.03.15 |
申请号 |
CN201611007796.9 |
申请日期 |
2016.11.16 |
申请人 |
广西大学 |
发明人 |
何新霞 |
分类号 |
G06K9/32(2006.01)I |
主分类号 |
G06K9/32(2006.01)I |
代理机构 |
北京天奇智新知识产权代理有限公司 11340 |
代理人 |
但玉梅 |
主权项 |
一种文字识别方法,其特征在于,包括以下步骤:获取待识别图像;对已获取图像预处理:阈值化处理获得前景信息及背景信息单一的图像;图像倾斜校正以校正图像,所述图像倾斜校正包括以下步骤:对已阈值化处理图像取为待校正文本,待校正文本通过霍夫变换,提取图像中的直线,根据所述直线的长度和倾斜角度,对所述直线进行过滤;针对过滤后的直线,确定所述倾斜角度的中位数为所述待校正文本图像的倾斜角度;根据所述待校正文本图像的倾斜角度,对所述待校正文本图像进行旋转。分析处理图像:分析图像的行间纹理特征,获取图像的文字矩阵参数;分割图像:基于所述文字矩阵参数对图像进行切割,形成若干个子图像,获取图像的文字字块;识别:对文字字块进行单独处理,获取文字字块的图像特征,并对所述图像特征进行识别。 |
地址 |
530004 广西壮族自治区南宁市西乡塘区大学路100号 |