发明名称 一种XML文档树实例查询方法
摘要 本发明公开了一种XML文档树实例查询方法,属于模糊查询领域。本方法为:1)将数据库中的XML文档和待查询XML文档分别转化为文档树;2)根据待查询XML文档树在XML文档树数据库中选取节点数在设定范围内的XML文档树,得到一待计算数据集;3)计算待查询XML文档树与待计算数据集中每一XML文档树之间的相似度,得到一候选查询结果集;4)计算待查询XML文档树与候选查询结果集中XML文档树的编辑距离;5)根据4)计算的编辑距离对候选查询结果集中XML文档树进行排序,得到查询结果。与现有技术相比,本方法大大提高了查询效率,同时在一定程度上容忍目标数据与输入的错误。
申请公布号 CN102043848A 申请公布日期 2011.05.04
申请号 CN201010596864.6 申请日期 2010.12.20
申请人 北京大学 发明人 包小源;李树节;王腾蛟;杨冬青
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京君尚知识产权代理事务所(普通合伙) 11200 代理人 冯艺东
主权项 一种XML文档树实例查询方法,其步骤为:1)利用XML解析器将数据库中的XML文档转化为XML文档树,将输入的待查询XML文档转化为待查询XML文档树;2)根据待查询XML文档树的节点数量n和所选取的编辑距离L,在XML文档树数据库中选取节点数在设定范围内的XML文档树,得到一待计算数据集;其中,n、L为自然数;3)利用XML文档树近似编辑距离过滤法计算待查询XML文档树与待计算数据集中每一XML文档树之间的相似度,将相似度大于设定阈值的XML树组成一候选查询结果集;4)利用树编辑距离算法计算待查询XML文档树与候选查询结果集中XML文档树的编辑距离;5)根据4)计算的编辑距离对候选查询结果集中XML文档树进行排序,得到查询结果。
地址 100871 北京市海淀区颐和园路5号北京大学