发明名称 | 从复杂背景文档图像提取文本的装置、方法 | ||
摘要 | 本发明公开一种从具有复杂背景的文档图像中提取文本的装置、方法、计算机程序及其存储介质。根据本发明的从具有复杂背景的文档图像中提取文本的优选方法包括步骤:第一边缘提取步骤,用于从所述图像中提取具有比第一对比度阈值高的对比度的边缘;搜索步骤,用于从所述提取的边缘中搜索连通的边缘;以及第二边缘提取步骤,用于在所述搜索的连通边缘的像素数大于预定数目时,提取具有比第二对比度阈值高的对比度的边缘;其中所述第二对比度阈值比所述第一对比度阈值大。 | ||
申请公布号 | CN100517374C | 申请公布日期 | 2009.07.22 |
申请号 | CN200510135744.5 | 申请日期 | 2005.12.29 |
申请人 | 佳能株式会社 | 发明人 | 王艳清;游亚平;杜尚锋 |
分类号 | G06K9/32(2006.01)I | 主分类号 | G06K9/32(2006.01)I |
代理机构 | 中国国际贸易促进委员会专利商标事务所 | 代理人 | 康建峰 |
主权项 | 1.一种从具有复杂背景的文档图像中提取文本的装置,包括:边缘图计算单元(901),用于计算文档图像的边缘图;长背景连通区域去除单元(902),用于将边缘图计算单元(901)所计算的边缘图中的边缘分成“正边缘”和“负边缘”两类、搜索由相同类型的边缘构成的连通区域、以及去除比预定阈值长的由相同类型的边缘构成的连通区域;边缘图重计算单元(903),用于在由相同类型的边缘构成的长连通区域已经被长背景连通区域去除单元(902)去除的边缘图中搜索由两类边缘构成的连通区域、并针对比第二预定阈值长的由两类边缘构成的连通区域的边界框重计算局部边缘图;文本图标记单元(904),用于在边缘图重计算单元重计算边缘图之后将连通区域划分为三种类型“正常文本”、“反转文本”和“背景”并生成标记图,其中将“正常文本”连通区域的前景像素标记为“正常文本”,将“反转文本”连通区域的前景像素标记为“反转文本”,以及将剩余像素标记为“背景”;以及文本连通区域搜索和合并单元(905),用于搜索文本图标记单元(904)所生成的标记图上由具有相同标记的像素形成的连通区域并将该连通区域形成文本行。 | ||
地址 | 日本东京 |