发明名称 文档图像识别方法和设备
摘要 本发明公开了文档图像识别方法和设备。用于识别具有混合的主要语言和次要语言的字母的文档图像的方法包括分割步骤,用于将文档图像分割成至少一个长字符串;提取步骤,用于从该至少一个长字符串中的每一个中根据该长字符串中包含的特殊字符提取字符串单元;以及识别步骤,用于基于各识别的字符串单元来识别该文档图像。
申请公布号 CN103902993A 申请公布日期 2014.07.02
申请号 CN201210583676.9 申请日期 2012.12.28
申请人 佳能株式会社 发明人 李建杰;李献
分类号 G06K9/20(2006.01)I 主分类号 G06K9/20(2006.01)I
代理机构 中国国际贸易促进委员会专利商标事务所 11038 代理人 康建忠
主权项 一种具有混合的主要语言的和次要语言的字母的文档图像的识别方法,包括:分割步骤,用于将文档图像分割成至少一个长字符串;提取步骤,用于从该至少一个长字符串中的每一个中根据该长字符串中包含的特殊符号提取字符串单元;以及识别步骤,用于基于各提取的字符串单元来识别该文档图像。
地址 日本东京