发明名称 面向中文环境的复杂场景文本定位方法
摘要 本发明公开了一种面向中文环境的复杂场景文本定位方法,主要解决现有技术在复杂背景下场景文本定位虚警率较高的问题。该方法结合基于边缘的文本定位方法和基于纹理的文本定位方法的优点,将边缘和纹理特征进行分阶段组合。首先利用边缘特征进行文本区域的检测,即对下采样后彩色图像进行边缘提取、二值化处理,采用形态学运算将字符边缘连接成块,对每个连通域进行特征提取,通过级联阈值分类器排除大量的非字符连通域,得到备选的字符连通域;然后提取备选字符连通域的纹理特征,通过BP网络分类器进一步确认是否为字符连通域。本发明具有在复杂光照和背景情况下文本定位准确率高、速度快的优点,可用于复杂场景中的文本自动提取与识别。
申请公布号 CN102163284A 申请公布日期 2011.08.24
申请号 CN201110088320.3 申请日期 2011.04.11
申请人 西安电子科技大学 发明人 卢朝阳;刘晓佩;李静;汪文芳;王伟
分类号 G06K9/60(2006.01)I;G06K9/00(2006.01)I 主分类号 G06K9/60(2006.01)I
代理机构 陕西电子工业专利中心 61205 代理人 王品华;朱红星
主权项 一种面向中文环境的复杂场景文本定位方法,其步骤包括如下:(1)对分辨率为1600*1200的原始图像进行下采样,将其转换为分辨率为400*300的图像;(2)对分辨率为400*300的图像进行彩色边缘提取,并进行灰度化,得到灰度边缘图像E;(3)对灰度边缘图像E进行自适应二值化,得到二值边缘图像I:3a)将灰度边缘图像E进行分块,块的大小为10*10;3b)采用局部阈值T对每一分块进行二值化,T的计算公式为:T=k1*m+k2*s其中,m为灰度边缘图像E的全局灰度均值,s为局部灰度方差,k1和k2分别为全局均值和局部灰度方差的加权系数;(4)去除二值边缘图像中长度大于该图像宽度一半的直线、长度小于50的孤立短线和背景中的噪声点,然后对其进行形态学处理,将保留下来的边缘连接成块,得到二值图像;(5)对二值图像C进行连通区域标记,得到每个连通区域的位置、长度和宽度信息;然后提取连通域的几何特征,对几何特征建立级联阈值分类器,去除一部分明显为非字符的连通区域,得到备选字符连通区域集合;(6)提取每个备选字符连通区域的纹理特征,将其作为BP分类器的输入,通过该分类器验证连通区域是否为字符连通区域,如果是字符连通区域则保留并作为定位的文字区域,否则去除。
地址 710071 陕西省西安市西安市太白南路2号
您可能感兴趣的专利