发明名称 |
一种图像文字识别的方法和装置 |
摘要 |
本发明提供了一种图像文字识别的方法和装置,其中方法包括:S1、获取待识别图像中的文字区域;S2、对文字区域中的各字块分别进行识别并记录各字块的位置信息;S3、基于各字块的位置信息进行版面分析得到语句结构分布;S4、基于语句结构分布对各字块的识别结果进行基于语义分析的校正,得到校正后的识别结果。本发明有效地利用了文字之间的语义信息对各字块的识别结果进行修正,提高了图像文字识别的精度,更好地满足了用户的识别需求。 |
申请公布号 |
CN103577818A |
申请公布日期 |
2014.02.12 |
申请号 |
CN201210279370.4 |
申请日期 |
2012.08.07 |
申请人 |
北京百度网讯科技有限公司 |
发明人 |
韩钧宇;丁二锐;吴中勤;文林福 |
分类号 |
G06K9/20(2006.01)I |
主分类号 |
G06K9/20(2006.01)I |
代理机构 |
北京鸿德海业知识产权代理事务所(普通合伙) 11412 |
代理人 |
袁媛 |
主权项 |
一种图像文字识别的方法,其特征在于,该方法包括:S1、获取待识别图像中的文字区域;S2、对文字区域中的各字块分别进行识别并记录各字块的位置信息;S3、基于各字块的位置信息进行版面分析得到语句结构分布;S4、基于语句结构分布对各字块的识别结果进行基于语义分析的校正,得到校正后的识别结果。 |
地址 |
100085 北京市海淀区上地十街10号百度大厦2层 |