发明名称 |
基于深度学的图形图案文字检测方法 |
摘要 |
本发明公开了一种基于深度学的图形图案文字检测方法,首先,通过图形图案文字样本合成训练深度卷积自编码网络,然后使用已标记的样本,通过稀疏字典进行分类。随机从样本库中抽取图形图案文字,并进行旋转、平移、透射等变换,再与纯背景图进行融合;之后使用合成的样本集,建立深度卷积自编码网络,并使用分层训练、整体调优的方式学特征模板;然后对已有的标记样本,使用深度网络学得到的特征模板进行特征提取;最后把提取的特征上采样至原图大小,并以单个分块作为识别的单位,训练稀疏字典以及分类器。在完成训练步骤后,对待处理的图像进行多分辨率分解,并使用特征模板提取特征,再使用稀疏字典进行分类获取结果。 |
申请公布号 |
CN104794504A |
申请公布日期 |
2015.07.22 |
申请号 |
CN201510207913.5 |
申请日期 |
2015.04.28 |
申请人 |
浙江大学 |
发明人 |
于慧敏;李天豪 |
分类号 |
G06K9/66(2006.01)I;G06T7/00(2006.01)I |
主分类号 |
G06K9/66(2006.01)I |
代理机构 |
杭州求是专利事务所有限公司 33200 |
代理人 |
邱启旺 |
主权项 |
一种基于深度学习的图形图案文字检测方法,其特征在于,包括以下步骤:步骤1:预处理:输入彩色图像,并将输入的彩色图像转为灰度图,并进行多分辨率分解,输出不同分辨率的图像;步骤2:特征提取:对步骤1输出的每一个分辨率的图像,分别通过深度卷积自编码网络提取特征图;其中深度卷积自编码网络是通过训练获得;步骤3:稀疏编码求解:把步骤2提取得到的所有特征图,上采样至原图大小。对该组特征图进行分块,每一块分别通过稀疏字典和线性分类器进行分类识别。步骤4:图形图案文字定位:对步骤3输出的每个分块的分类识别结果进行区域融合,合成最终的定位结果。 |
地址 |
310058 浙江省湖州市西湖区余杭塘路866号 |