发明名称 一种基于递归神经网络的复杂图像文字序列识别系统
摘要 本发明涉及图像文字识别领域,特别涉及一种基于递归神经网络的复杂图像文字序列识别系统,系统包括图像文字输入模块、滑动采样模块、CNN以及RNN,所述图像文字输入模块为扫描仪、数码相机或者图像文字存储模块;本系统中滑动采样模块对待识别图像文字序列进行滑动采样并将采样子图片输入到CNN中,CNN提取特征并输出到RNN中,所述RNN根据CNN输入信号,上一时刻CNN的输出数据以及上一时刻CNN识别结果转化成的向量数据,依次识别出汉字的前部分、汉字的后部分、数字、字母或者标点符号。本发明系统克服了复杂图像文字序列的切分难题,且不需构建额外的语言模型,显著提高了复杂图像文字序列的识别效率和准确率。
申请公布号 CN105654130A 申请公布日期 2016.06.08
申请号 CN201511020613.2 申请日期 2015.12.30
申请人 成都数联铭品科技有限公司 发明人 刘世林;何宏靖;陈炳章;吴雨浓;姚佳
分类号 G06K9/62(2006.01)I;G06N3/08(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 代理人
主权项 一种基于递归神经网络的复杂图像文字序列识别系统,其特征在于,包含图像文字输入模块、滑动采样模块、卷积神经网络以及递归神经网络分类器,其中所述滑动采样模块使用滑动采样框对图像文字输入模块所输入的待识别图像文字序列进行滑动采样,并将采样所获得的子图片输入到卷积神经网络中;所述卷积神经网络提取所述子图片的特征,并将提取到的特征输入到所述递归神经网络分类器中;所述递归神经网络分类器根据卷积神经网络提取的特征数据、上一时刻递归神经网络分类器的输出数据以及上一时刻递归神经网络分类器识别结果转化成的向量数据,计算出该时刻图像文字序列识别结果。
地址 610041 四川省成都市高新区天府大道中段666号希顿国际广场B座1005