发明名称 一种带有文本行的柱面图像的定位方法
摘要 本发明涉及一种带有文本行的柱面图像的定位方法,包括:对柱面图像进行二值化,求取图像的上下与左右边界,将柱面图像从背景区域中提取出来;二值图像噪声的形态学剔除;确定文本行连通区域;提取各个具有一定长度的文本行连通区域的基准线;对柱面图像进行分区域展平;采用SURF特征检测算法对展平后的柱面图像和模板图像分别进行SURF特征检测;利用最近邻方法进行特征点粗匹配;获得展平后的柱面图像和模板图像精确的匹配对;在展平后的柱面图像中找出与模板图像匹配的子图,实现模板图像的精确定位。本发明可以实现带有文本行的柱面图像精确定位。
申请公布号 CN106096490A 申请公布日期 2016.11.09
申请号 CN201610073394.2 申请日期 2016.02.02
申请人 天津大学 发明人 肖夏;田健飞
分类号 G06K9/00(2006.01)I;G06K9/20(2006.01)I;G06K9/46(2006.01)I 主分类号 G06K9/00(2006.01)I
代理机构 天津市北洋有限责任专利代理事务所 12201 代理人 程毓英
主权项 一种带有文本行的柱面图像的定位方法,包括下列步骤:1)对柱面物体拍照,获得带有文本行的柱面图像;2)对柱面图像进行二值化,求取图像的上下与左右边界,将柱面图像从背景区域中提取出来;3)根据字符大小设定面积阈值,对柱面图像的二值图像进行连通区域标记,将面积小于预设面积阈值的连通区域剔除,实现对二值图像噪声的形态学剔除;4)采用长度为柱面图像中每两个字符之间的距离、高度为每个字符高度1/3的矩形结构元素对经过形态学噪声剔除的二值化图像进行开运算,使每个文本行连成同一连通区域,计算每个连通区域左右边界像素位置l<sub>si</sub>和l<sub>ei</sub>,以及连通区域每列像素高度值h<sub>i</sub>(x),i表示不同的连通区域;5)确定文本行连通区域:计算每个连通区域的平均高度,将连通区域的平均高度H<sub>i</sub>大于预设高度T<sub>h</sub>的连通区域剔除,实现对插图连通区域的剔除;将长度l<sub>i</sub>=l<sub>ei</sub>‑l<sub>si</sub>短于预设长度阈值T<sub>l</sub>的连通区域剔除,实现对较短文本行连通区域的剔除,最后剩下的即为具有一定长度的文本行连通区域;6)提取各个具有一定长度的文本行连通区域的基准线;7)对柱面图像进行分区域展平,首先对步骤6)提取的各条基准线进行Hough变换,找出基准线中最长的直线方向,即为柱面图像展平的方向,将图像旋转使图像展平方向转为水平方向,然后将每条基准线展平,并分区域按照基准线对柱面图像展平;8)输入模板图像,采用SURF特征检测算法对展平后的柱面图像和模板图像分别进行SURF特征检测;9)利用最近邻方法进行特征点粗匹配,将粗匹配的潜在匹配对按照特征点在模板图像中横坐标由小到大的顺序进行排序;10)计算每个潜在匹配对中两个特征点所在位置的欧式距离d<sub>i</sub>,以特征点在模板图像中横坐标x<sub>i</sub>为自变量,以实际的欧式距离d<sub>i</sub>为因变量,进行曲线拟合,得出拟合曲线f<sub>d</sub>(x),然后将每个潜在匹配对的横坐标x<sub>i</sub>代入曲线f<sub>d</sub>(x)中,计算出曲线拟合出的两个特征点间的欧式距离f<sub>d</sub>(x<sub>i</sub>),并计算和实际的欧式距离d<sub>i</sub>的差值:S<sub>i</sub>=|f<sub>d</sub>(x<sub>i</sub>)‑d<sub>i</sub>|,若S<sub>i</sub>大于预设误差阈值T<sub>S</sub>则认为是误匹配,进行剔除;11)按照步骤10)的方法,对匹配对内两个特征点所构成的连线与水平方向的夹角进行曲线拟合,剔除角度不满足变换趋势的点,获得展平后的柱面图像和模板图像精确的匹配对;12)根据展平后的柱面图像和模板图像中精确匹配的特征点对的坐标位置关系,在展平后的柱面图像中找出与模板图像匹配的子图,实现模板图像的精确定位。
地址 300072 天津市南开区卫津路92号