发明名称 结构化文档检索装置和程序
摘要 本发明提供一种结构化文档检索装置和程序,能够进行组合了基于XML标签的结构信息和基于注释标签的结构信息的双方的结构检索。具备:处理器,其执行程序;第一存储区域,其存储程序;第二存储区域,其存储满足树结构条件的结构化文档以及对该文档附加的注释数据;文档结构列表构筑部,其针对使根据上述结构化文档的标签的包含关系和上述注释数据的标签的包含关系单独得到的DOM树的根要素通用化的结构,分配结构化文档的文本,生成文本共有DOM树;检索处理部,其从文本共有DOM树中检索与检索查询符合的要素。
申请公布号 CN103425719A 申请公布日期 2013.12.04
申请号 CN201310057197.8 申请日期 2013.02.22
申请人 株式会社日立制作所 发明人 小岛要
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京银龙知识产权代理有限公司 11243 代理人 许静;郭凤麟
主权项 一种结构化文档检索装置,其特征在于,具备:处理器,其执行程序;第一存储区域,其存储程序;第二存储区域,其存储满足树结构条件的结构化文档以及对该文档附加的注释数据;文档结构列表构筑部,其针对使根据上述结构化文档的标签的包含关系和上述注释数据的标签的包含关系单独得到的DOM树的根要素通用化的结构,分配结构化文档的文本,生成文本共有DOM树;输入装置,其用于输入检索查询;地址路径检索部,其从上述文本共有DOM树中检索与作为上述检索查询提供的位置路径符合的要素。
地址 日本东京都