发明名称 一种关系-XML混合数据关键字查询方法
摘要 本发明公开了一种关系-XML混合数据关键字查询方法。本发明为:1)根据数据库的模式信息从数据库中读取数据,生成元组数据图;数据库为对关系数据和XML数据是逻辑上共同存储,物理上分开存储;2)对关系数据与XML数据进行倒排索引;3)查找输入关键字出现的对应位置;若在某个元组中,则标记该元组为候选节点,然后在元组数据图中查找包含该候选节点的最小生成树;若在某个XML文档中,则将该文档所在元组标记为候选节点,然后在元组数据图中查找包含该候选节点的最小生成树,再在该XML文档中查找包含关键字的最小公共祖先节点;4)返回包含查询关键字结构信息的关系-XML数据查询结果。本发明实现了混合数据的关键字查询。
申请公布号 CN103150404B 申请公布日期 2016.06.15
申请号 CN201310104904.4 申请日期 2013.03.28
申请人 北京大学 发明人 李树节;陈薇;王腾蛟;杨冬青
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京君尚知识产权代理事务所(普通合伙) 11200 代理人 冯艺东
主权项 一种关系‑XML混合数据关键字查询方法,其步骤为:1)根据数据库的模式信息从数据库中读取数据,其中将关系表中的每个元组作为一个节点,关系表间的主外键联系作为边,生成元组数据图;所述数据库为对关系数据和XML数据的存储是逻辑上共同存储,物理上分开存储,数据库的关系表中实际存储的是XML数据的标识符XID,通过XID和XML目录表确定XML数据实际存储的物理位置;2)对所述数据库中的关系数据与XML数据分别进行倒排索引;3)在所述倒排索引中查找输入关键字出现的对应位置;若出现在某个元组中,则标记该元组为候选节点,然后在所述元组数据图中查找包含该候选节点的最小生成树;若出现在某个XML文档中,则将该XML文档所在元组标记为候选节点,然后在所述元组数据图中查找包含该候选节点的最小生成树,再在该XML文档中查找包含关键字的最小公共祖先节点;4)返回包含查询关键字结构信息的关系‑XML数据查询结果;其中,返回所述查询结果时,对以所述最小公共祖先节点为根的文档树进行处理,只返回以所述最小公共祖先节点为根的文档树中命中关键字的节点的直系祖先节点,即返回包含关键字的最小最低公共祖先节点。
地址 100871 北京市海淀区颐和园路5号北京大学