发明名称 |
一种复杂图像文字序列识别方法 |
摘要 |
本发明涉及图像文字识别领域,特别涉及一种复杂图像文字序列识别方法,本发明采用一个滑动采样框对待识别图像文字序列进行滑动采样,通过CNN对采样获得的子图片进行特征提取,然后将特征输出到RNN中,所述RNN根据输入信号,依次识别出汉字的前部分、汉字的后部分、数字、字母、标点符号或者空白;依次记录和整合各个时刻RNN的识别结果,获得完整的识别结果;所述RNN每个时刻的输入信号还包括上一时刻递归神经网络的输出信号。本发明方法克服了复杂图像文字序列的切分难题,显著提高了图像文字的识别效率和准确率。 |
申请公布号 |
CN105678300A |
申请公布日期 |
2016.06.15 |
申请号 |
CN201511020647.1 |
申请日期 |
2015.12.30 |
申请人 |
成都数联铭品科技有限公司 |
发明人 |
刘世林;何宏靖;陈炳章;吴雨浓;姚佳 |
分类号 |
G06K9/34(2006.01)I |
主分类号 |
G06K9/34(2006.01)I |
代理机构 |
|
代理人 |
|
主权项 |
一种复杂图像文字序列识别方法,其特征在于,包含以下实现过程:经过一个滑动采样框对待处理图像文字序列进行滑动采样,并将采样获得的子图片输入到卷积神经网络中;由所述卷积神经网络对输入的子图片提取特征,并将提取的特征数据输入到递归神经网络中,由所述递归神经输出识别结果;所述递归神经网络的输入信号还包括:上一时刻递归神经网络的输出数据;依次迭代,将每个时刻所述递归神经网络的识别结果记录合并,得到待处理图像文字序列的识别结果。 |
地址 |
610041 四川省成都市高新区天府大道中段666号希顿国际广场B座1005 |