发明名称 块分割、识别与索引视觉元素及搜索文档的系统与方法
摘要 一种分割、识别、索引视觉元素并搜索文档的方法包括为每个文档生成元数据,使用元数据将所述文档分割成块,执行对被识别的块的块操作,使用数据和元数据规则识别并索引内嵌视觉元素,使用配置文件识别并索引块视觉元素,搜索包含视觉元素的文档。
申请公布号 CN102741838B 申请公布日期 2017.05.03
申请号 CN201080054420.8 申请日期 2010.10.04
申请人 A·穆苏卢里 发明人 A·穆苏卢里
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 上海一平知识产权代理有限公司 31266 代理人 须一平;成春荣
主权项 一种处理文档的方法,所述方法包括:生成文档的初始元数据,该文档具有源内容和表示语义;基于所述初始元数据将所述文档划分为一个或多个被识别的块,每个块表示该文档内的逻辑单元,该识别基于将生成的一段的初始元数据中的键/值对与块识别标准集中的标准进行比较,其中,对于至少一个标准集中的所有标准,关于元数据计算为真指示所述文档的所述段是块;准备所述一个或多个被识别的块的一个块列表;使用块操作在所述块列表中处理所述一个或多个被识别的块;识别所述块列表中的至少一个被识别的块的至少一个标题块项。
地址 美国阿拉巴马州