发明名称 从可移植电子文档中提取光栅图像的方法和设备
摘要 本发明提供一种通过分析可移植电子文档的格式来提取其中的光栅图像的方法和设备。一种从可移植电子文档中提取光栅图像的方法,包含以下步骤:a)解析可移植电子文档的格式以获取每页中与光栅图像相关的命令和资源;b)处理所述命令和资源来提取候选光栅图像;c)合并相连接的候选光栅图像;以及d)去除虚警光栅图像。本发明实现了不论内联光栅图像还是ImageXObject光栅图像均可提取,且视觉上完整的光栅图像将作为一个完整的图像提取,并排除了作为非感知意义上的内容的细长分割线。
申请公布号 CN101901341A 申请公布日期 2010.12.01
申请号 CN200910141741.0 申请日期 2009.05.25
申请人 株式会社理光 发明人 杜成;徐文晖;长谷川史裕;井上浩一
分类号 G06K9/20(2006.01)I;G06F17/30(2006.01)I 主分类号 G06K9/20(2006.01)I
代理机构 北京市柳沈律师事务所 11105 代理人 黄小临
主权项 一种从可移植电子文档中提取光栅图像的方法,包含以下步骤:a)解析可移植电子文档的格式以获取每页中与光栅图像相关的命令和资源;b)处理所述命令和资源来提取候选光栅图像;c)合并相连接的候选光栅图像;以及d)去除虚警光栅图像。
地址 日本东京都