发明名称 字符信息识别装置和方法
摘要 本发明提供了一种字符信息识别装置和方法,其输入包含字符串的字符串图像,由该字符串图像识别出所述字符串,其中该字符串被分隔符划分为两个以上的字段。本发明的字符信息识别装置包括:切分单元,其将字符串图像切分成多个片段;分隔符识别单元,其基于切分后的片段,识别出分隔符,从而将所述多个片段分成多个片段集;词典数据库,其中存储了多个预定的字符组;以及识别单元,其对于各个片段集,将该片段集的至少一部分识别为词典数据库中的字符组,从而识别出各个字段。根据本发明,可以大大提高手写体的Email地址、网络地址等信息的识别精度,即使在存在笔画粘接的情况下,也可以在满意的精度下进行识别。
申请公布号 CN101520851A 申请公布日期 2009.09.02
申请号 CN200810080950.4 申请日期 2008.02.29
申请人 富士通株式会社 发明人 郑大念;孙俊;直井聪;堀田悦伸;皆川明洋;藤本克仁
分类号 G06K9/72(2006.01)I;G06K9/00(2006.01)I 主分类号 G06K9/72(2006.01)I
代理机构 北京三友知识产权代理有限公司 代理人 黄纶伟
主权项 1. 一种字符信息识别装置,其输入包含字符串的字符串图像,由该字符串图像识别出所述字符串,其中该字符串被分隔符划分为两个以上的字段,其特征在于,该字符信息识别装置包括:切分单元,其将所述字符串图像切分成多个片段;分隔符识别单元,其基于所述切分单元切分后的所述片段,识别出分隔符,从而将所述多个片段分成多个片段集;词典数据库,其中存储了多个预定的字符组;以及识别单元,其对于各个所述的片段集,将该片段集的至少一部分识别为所述词典数据库中的字符组,从而识别出各个所述的字段。
地址 日本神奈川县川崎市