发明名称 一种奶盒喷打字符识别的方法
摘要 本发明提供一种奶盒喷打字符识别的方法,包括下列步骤:采集一幅包含有奶盒喷打字符的图像;对其进行图像校正;在进行单个字符识别前,需要将各个字符分割成独立区域;将分割出的各个字符区域进行单独识别:对每个字符区域,提取特征;识别字符。本发明可以实现喷打字符的快速准确的识别。
申请公布号 CN104463124A 申请公布日期 2015.03.25
申请号 CN201410763879.5 申请日期 2014.12.11
申请人 天津普达软件技术有限公司 发明人 任海燕;杨文田;关帅;余天洪
分类号 G06K9/00(2006.01)I;G06K9/54(2006.01)I 主分类号 G06K9/00(2006.01)I
代理机构 天津市北洋有限责任专利代理事务所 12201 代理人 程毓英
主权项 一种奶盒喷打字符识别的方法,包括下列步骤:(1)采集一幅包含有奶盒喷打字符的图像;(2)对其进行图像校正:字符喷打在奶盒上部白色区域中,先进行图像二值化处理,通过计算各个连通区域的面积大小将此白色区域筛选出来,定义该区域为区域A。然后由白色区域中黑色字符计算出图像的旋转角度,进行图像旋转校正;(3)在进行单个字符识别前,需要将各个字符分割成独立区域,分割区域A内字符步骤如下:1)由于字符为点打字符因此首先对区域A内字符进行点打亮度增强,由于图像中字符每个点半径大小接近3像素,选用7*7的模板对图像进行点打亮度增强,模板如下:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mfrac><mn>1</mn><mn>336</mn></mfrac><mfenced open='[' close=']'><mtable><mtr><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mo>-</mo><mn>21</mn></mtd><mtd><mo>-</mo><mn>21</mn></mtd><mtd><mo>-</mo><mn>21</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mo>-</mo><mn>21</mn></mtd><mtd><mn>16</mn></mtd><mtd><mn>16</mn></mtd><mtd><mn>16</mn></mtd><mtd><mo>-</mo><mn>21</mn></mtd><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mo>-</mo><mn>21</mn></mtd><mtd><mn>16</mn></mtd><mtd><mn>16</mn></mtd><mtd><mn>16</mn></mtd><mtd><mn>16</mn></mtd><mtd><mn>16</mn></mtd><mtd><mo>-</mo><mn>21</mn></mtd></mtr><mtr><mtd><mo>-</mo><mn>21</mn></mtd><mtd><mn>16</mn></mtd><mtd><mn>16</mn></mtd><mtd><mn>16</mn></mtd><mtd><mn>16</mn></mtd><mtd><mn>16</mn></mtd><mtd><mo>-</mo><mn>21</mn></mtd></mtr><mtr><mtd><mo>-</mo><mn>21</mn></mtd><mtd><mn>16</mn></mtd><mtd><mn>16</mn></mtd><mtd><mn>16</mn></mtd><mtd><mn>16</mn></mtd><mtd><mn>16</mn></mtd><mtd><mo>-</mo><mn>21</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mo>-</mo><mn>21</mn></mtd><mtd><mn>16</mn></mtd><mtd><mn>16</mn></mtd><mtd><mn>16</mn></mtd><mtd><mo>-</mo><mn>21</mn></mtd><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mo>-</mo><mn>21</mn></mtd><mtd><mo>-</mo><mn>21</mn></mtd><mtd><mo>-</mo><mn>21</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd></mtr></mtable></mfenced></mrow>]]></math><img file="FDA0000630991720000011.GIF" wi="1076" he="618" /></maths>2)经过校正的图像二值化处理,即当图像中某点像素值大于阈值TS时设置该点像素值为255,反之为0;3)根据字符各个点之间的距离及字符形状,采用横向[1 1 1 1 1]、纵向<maths num="0002" id="cmaths0002"><math><![CDATA[<mfenced open='[' close=']'><mtable><mtr><mtd><mn>1</mn></mtd></mtr><mtr><mtd><mn>1</mn></mtd></mtr><mtr><mtd><mn>1</mn></mtd></mtr><mtr><mtd><mn>1</mn></mtd></mtr><mtr><mtd><mn>1</mn></mtd></mtr></mtable></mfenced>]]></math><img file="FDA0000630991720000012.GIF" wi="75" he="383" /></maths>斜向<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><mfenced open='[' close=']'><mtable><mtr><mtd><mn>1</mn></mtd><mtd></mtd><mtd></mtd><mtd></mtd><mtd></mtd></mtr><mtr><mtd></mtd><mtd><mn>1</mn></mtd><mtd></mtd><mtd></mtd><mtd></mtd></mtr><mtr><mtd></mtd><mtd></mtd><mtd><mn>1</mn></mtd><mtd></mtd><mtd></mtd></mtr><mtr><mtd></mtd><mtd></mtd><mtd></mtd><mtd><mn>1</mn></mtd><mtd></mtd></mtr><mtr><mtd></mtd><mtd></mtd><mtd></mtd><mtd></mtd><mtd><mn>1</mn></mtd></mtr></mtable></mfenced><mo>,</mo><mfenced open='[' close=']'><mtable><mtr><mtd></mtd><mtd></mtd><mtd></mtd><mtd></mtd><mtd><mn>1</mn></mtd></mtr><mtr><mtd></mtd><mtd></mtd><mtd></mtd><mtd><mn>1</mn></mtd><mtd></mtd></mtr><mtr><mtd></mtd><mtd></mtd><mtd><mn>1</mn></mtd><mtd></mtd><mtd></mtd></mtr><mtr><mtd></mtd><mtd><mn>1</mn></mtd><mtd></mtd><mtd></mtd><mtd></mtd></mtr><mtr><mtd><mn>1</mn></mtd><mtd></mtd><mtd></mtd><mtd></mtd><mtd></mtd></mtr></mtable></mfenced></mrow>]]></math><img file="FDA0000630991720000013.GIF" wi="802" he="388" /></maths>模板对经过步骤2)处理得到的二值图像依次进行闭运算处理,进而将每个字符分割呈单独连通区域,最后根据字符的宽度、高度、面积特征筛选出符合要求的区域,去除干扰点;(4)将分割出的各个字符区域进行单独识别:对每个字符区域,提取如下的特征:字符图像水平方向投影所对应灰度值、字符图像垂直方向投影所对应灰度值、字符纵横比、字符倾斜度、字符紧凑度、字符凸凹性、字符二阶不变矩、字符三阶不变矩、字符孔洞数量、字符连通区域个数;得到特征向量,通过各个字符的特征向量训练神经网络系统,得出各个节点的值,当需要进行字符识别时只需将该字符的特征向量提取,然后输入已训练好的神经网络,即可识别该字符并得到该字符的相似度。
地址 300457 天津市滨海新区经济技术开发区泰达服务外包产业园2101(六大街与北海路交口)