发明名称 |
一种从图像中提取文字行的方法及装置 |
摘要 |
本发明提供了一种从图像中提取文字行的方法及装置,其中从图像中提取文字行的方法包括:A.对图像进行二值化处理,以得到所述图像的各个连通域;B.对不满足第一统计特征的连通域进行过滤,其中所述第一统计特征是对标注好的样本中提取的连通域描述特征进行统计学后得到的属于文字连通域的统计特征;C.从过滤后的各个连通域中提取所述图像中的文字行。通过上述方式,本发明可以大大提高从图像中提取的文字行的准确性。 |
申请公布号 |
CN102930262A |
申请公布日期 |
2013.02.13 |
申请号 |
CN201210350550.7 |
申请日期 |
2012.09.19 |
申请人 |
北京百度网讯科技有限公司 |
发明人 |
韩钧宇;刘经拓;丁二锐 |
分类号 |
G06K9/20(2006.01)I;G06K9/54(2006.01)I |
主分类号 |
G06K9/20(2006.01)I |
代理机构 |
北京鸿德海业知识产权代理事务所(普通合伙) 11412 |
代理人 |
倪志华 |
主权项 |
一种从图像中提取文字行的方法,包括:A.对图像进行二值化处理,以得到所述图像的各个连通域;B.对不满足第一统计特征的连通域进行过滤,其中所述第一统计特征是对标注好的样本中提取的连通域描述特征进行统计学习后得到的属于文字连通域的统计特征;C.从过滤后的各个连通域中提取所述图像中的文字行。 |
地址 |
100085 北京市海淀区上地十街10号百度大厦2层 |