发明名称 |
字符信息识别装置和方法 |
摘要 |
本发明提供了一种字符信息识别装置和方法,其输入包含字符串的字符串图像,由该字符串图像识别出所述字符串,其中该字符串被分隔符划分为两个以上的字段。本发明的字符信息识别装置包括:切分单元,其将字符串图像切分成多个片段;分隔符识别单元,其基于切分后的片段,识别出分隔符,从而将所述多个片段分成多个片段集;词典数据库,其中存储了多个预定的字符组;以及识别单元,其对于各个片段集,将该片段集的至少一部分识别为词典数据库中的字符组,从而识别出各个字段。根据本发明,可以大大提高手写体的Email地址、网络地址等信息的识别精度,即使在存在笔画粘接的情况下,也可以在满意的精度下进行识别。 |
申请公布号 |
CN101520851A |
申请公布日期 |
2009.09.02 |
申请号 |
CN200810080950.4 |
申请日期 |
2008.02.29 |
申请人 |
富士通株式会社 |
发明人 |
郑大念;孙俊;直井聪;堀田悦伸;皆川明洋;藤本克仁 |
分类号 |
G06K9/72(2006.01)I;G06K9/00(2006.01)I |
主分类号 |
G06K9/72(2006.01)I |
代理机构 |
北京三友知识产权代理有限公司 |
代理人 |
黄纶伟 |
主权项 |
1. 一种字符信息识别装置,其输入包含字符串的字符串图像,由该字符串图像识别出所述字符串,其中该字符串被分隔符划分为两个以上的字段,其特征在于,该字符信息识别装置包括:切分单元,其将所述字符串图像切分成多个片段;分隔符识别单元,其基于所述切分单元切分后的所述片段,识别出分隔符,从而将所述多个片段分成多个片段集;词典数据库,其中存储了多个预定的字符组;以及识别单元,其对于各个所述的片段集,将该片段集的至少一部分识别为所述词典数据库中的字符组,从而识别出各个所述的字段。 |
地址 |
日本神奈川县川崎市 |