发明名称 一种复杂图像文字序列识别方法
摘要 本发明涉及图像文字识别领域,特别涉及一种复杂图像文字序列识别方法,本发明采用一个滑动采样框对待识别图像文字序列进行滑动采样,通过CNN对采样获得的子图片进行特征提取,然后将特征输出到RNN中,所述RNN根据输入信号,依次识别出汉字的前部分、汉字的后部分、数字、字母、标点符号或者空白;依次记录和整合各个时刻RNN的识别结果,获得完整的识别结果;所述RNN每个时刻的输入信号还包括上一时刻递归神经网络的输出信号。本发明方法克服了复杂图像文字序列的切分难题,显著提高了图像文字的识别效率和准确率。
申请公布号 CN105678300A 申请公布日期 2016.06.15
申请号 CN201511020647.1 申请日期 2015.12.30
申请人 成都数联铭品科技有限公司 发明人 刘世林;何宏靖;陈炳章;吴雨浓;姚佳
分类号 G06K9/34(2006.01)I 主分类号 G06K9/34(2006.01)I
代理机构 代理人
主权项 一种复杂图像文字序列识别方法,其特征在于,包含以下实现过程:经过一个滑动采样框对待处理图像文字序列进行滑动采样,并将采样获得的子图片输入到卷积神经网络中;由所述卷积神经网络对输入的子图片提取特征,并将提取的特征数据输入到递归神经网络中,由所述递归神经输出识别结果;所述递归神经网络的输入信号还包括:上一时刻递归神经网络的输出数据;依次迭代,将每个时刻所述递归神经网络的识别结果记录合并,得到待处理图像文字序列的识别结果。
地址 610041 四川省成都市高新区天府大道中段666号希顿国际广场B座1005