发明名称 | 给文档编索引 | ||
摘要 | 本发明提供了用于检索文档的技术,该文档针对每一页都包括由处理该文档的应用程序忽略的区域并且包括与该文档的每个页子集相关联的不同内部索引集,其中每个不同内部索引集都与一个区域相关联并存储索引,而且其中每个所述索引都由名称-值对构成。然后,对于所述文档中的每一页,确定该页是否与一个内部索引集相关联;而且,响应于确定该页与一个内部索引集相关联,从所述内部索引集提取一个或多个名称-值对,其中所述一个或多个名称-值对中的每一个都提供关于该文档的特定信息,用于识别该文档。 | ||
申请公布号 | CN102959538A | 申请公布日期 | 2013.03.06 |
申请号 | CN201080058410.1 | 申请日期 | 2010.12.10 |
申请人 | 国际商业机器公司 | 发明人 | B·K·霍伊特;P·J·穆尔;G·S·菲尔德曼 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人 | 邹姗姗 |
主权项 | 一种计算机实现的方法,包括:检索包括至少一页的文档,该文档针对每一页都包括由处理该文档的应用程序忽略的区域,并且该文档包括与该文档的每个页子集相关联的不同内部索引集,其中每个不同内部索引集都与一个区域相关联并且存储索引,而且其中每个所述索引都由名称‑值对构成;及对于所述文档中的每一页,确定该页是否与一个内部索引集相关联;及响应于确定该页与一个内部索引集相关联,从该内部索引集提取一个或多个名称‑值对,其中所述一个或多个名称‑值对中的每一个都提供关于所述文档的特定信息,用于识别该文档。 | ||
地址 | 美国纽约 |