发明名称 |
一种从图像中抽取信息的方法及装置 |
摘要 |
本发明公开了一种从图像中抽取信息的方法及装置,用以提高对白框及对白文字的抽取效率。该方法包括:对所述图像中的待选区域进行背景底色连通域检测,确定至少一个背景底色连通区域为对白框候选区域;根据每个对白框候选区域的特征信息,从所述对白框候选区域中确定对白框区域;将所述对白框区域的边界进行逐步膨胀,确定所述对白框区域的边框边界;将所述边框边界以及该边框边界包含的区域确定为对白框完整区域,在所述图像中与所述对白框完整区域对应的区域进行抽取得到对白框。 |
申请公布号 |
CN102194118B |
申请公布日期 |
2013.04.10 |
申请号 |
CN201010117062.2 |
申请日期 |
2010.03.02 |
申请人 |
方正国际软件(北京)有限公司 |
发明人 |
袁梦尤;薛涛;蒋小森 |
分类号 |
G06K9/46(2006.01)I |
主分类号 |
G06K9/46(2006.01)I |
代理机构 |
北京同达信恒知识产权代理有限公司 11291 |
代理人 |
黄志华 |
主权项 |
一种从图像中抽取信息的方法,其特征在于,包括:对所述图像中的待选区域进行背景底色连通域检测,确定至少一个背景底色连通区域为对白框候选区域;根据每个对白框候选区域的特征信息,从所述对白框候选区域中确定对白框区域;根据未进行形态学闭操作之前所述待选区域中每个像素点对应的值,进行背景底色连通域检测,获取与所述对白框区域对应的初始背景底色连通区域;其中,所述待选区域中每个像素点对应的值是通过对所述待选区域的图像进行二值化处理获取的;将所述初始背景底色连通区域与所述对白框区域进行差值运算,得到至少一个连通域;根据所述对白框区域的面积确定第一阈值,将每个连通域的面积与所述第一阈值,以及预设的第二阈值进行比较,当连通域的面积小于等于第一阈值,且大于等于第二阈值时,确定该连通域为丢失的对白框的尖角区域,将所述尖角区域补充到所述对白框区域得到修正后的对白框区域;根据对所述修正后的对白框区域的边界膨胀设定的次数将所述修正后的对白框区域的边界进行逐步膨胀,确定所述修正后的对白框区域的边框边界;将所述边框边界以及该边框边界包含的区域确定为对白框完整区域,在所述图像中与所述对白框完整区域对应的区域进行抽取得到对白框。 |
地址 |
100080 北京市海淀区北四环西路52号中芯大厦19层 |