发明名称 基于深度学的图形图案文字检测方法
摘要 本发明公开了一种基于深度学的图形图案文字检测方法,首先,通过图形图案文字样本合成训练深度卷积自编码网络,然后使用已标记的样本,通过稀疏字典进行分类。随机从样本库中抽取图形图案文字,并进行旋转、平移、透射等变换,再与纯背景图进行融合;之后使用合成的样本集,建立深度卷积自编码网络,并使用分层训练、整体调优的方式学特征模板;然后对已有的标记样本,使用深度网络学得到的特征模板进行特征提取;最后把提取的特征上采样至原图大小,并以单个分块作为识别的单位,训练稀疏字典以及分类器。在完成训练步骤后,对待处理的图像进行多分辨率分解,并使用特征模板提取特征,再使用稀疏字典进行分类获取结果。
申请公布号 CN104794504A 申请公布日期 2015.07.22
申请号 CN201510207913.5 申请日期 2015.04.28
申请人 浙江大学 发明人 于慧敏;李天豪
分类号 G06K9/66(2006.01)I;G06T7/00(2006.01)I 主分类号 G06K9/66(2006.01)I
代理机构 杭州求是专利事务所有限公司 33200 代理人 邱启旺
主权项 一种基于深度学习的图形图案文字检测方法,其特征在于,包括以下步骤:步骤1:预处理:输入彩色图像,并将输入的彩色图像转为灰度图,并进行多分辨率分解,输出不同分辨率的图像;步骤2:特征提取:对步骤1输出的每一个分辨率的图像,分别通过深度卷积自编码网络提取特征图;其中深度卷积自编码网络是通过训练获得;步骤3:稀疏编码求解:把步骤2提取得到的所有特征图,上采样至原图大小。对该组特征图进行分块,每一块分别通过稀疏字典和线性分类器进行分类识别。步骤4:图形图案文字定位:对步骤3输出的每个分块的分类识别结果进行区域融合,合成最终的定位结果。
地址 310058 浙江省湖州市西湖区余杭塘路866号