发明名称 |
表格形式识别设备与方法 |
摘要 |
表格形式识别设备,它在表格形式学过程中学文件的分格线结构以及用户明确的管理信息如标题等的位置,并将它们存储于布局词典中。作业中,使从输入文件的图像中提取出的分格线结构与上述布局词典中文件内的分格线结构匹配。然后参考此布局词典中的位置信息而从输入文件中提取管理信息。 |
申请公布号 |
CN1271558C |
申请公布日期 |
2006.08.23 |
申请号 |
CN03132851.2 |
申请日期 |
1997.12.26 |
申请人 |
富士通株式会社 |
发明人 |
直井聪;胜山裕;武部浩明 |
分类号 |
G06K9/00(2006.01);G06F17/00(2006.01) |
主分类号 |
G06K9/00(2006.01) |
代理机构 |
中国国际贸易促进委员会专利商标事务所 |
代理人 |
朱海波 |
主权项 |
1.一种表格形式识别设备,此设备包括:存储装置(26),用来存储多个表格形式的分格线信息;组生成装置(27),用来获得从输入图像提取的且与所述存储装置(26)的分格线信息中所含分格线对应的分格线的多个可能组合,以找到作为满足预定关系的组合的、分格线的可兼容组合,其中在所述组合的每一个中从输入图像提取的多个分格线可以对应于所述存储装置的所述分格线信息中所含的一分格线,并且所述组生成装置还用来从这多个组合中提取一组两个或更多可兼容的组合,其中不能够包含另一组可兼容的组合中的组合,所提取的这组可兼容的组合表明:在所提取的组中的第一组合中的输入图像的分格线和在所提取的组中的第二组合中的输入图像的分格线之间的相对关系,与在所述第一组合中的表格形式的分格线和在所述第二组合中的表格形式的分格线之间的相对关系相兼容;以及比较装置(24),用来根据在一个或多个所提取的组的组合中所含的信息将输入图像与多个表格形式进行比较。 |
地址 |
日本神奈川 |