发明名称 一种基于结构概要的数据恢复方法
摘要 本发明公开了一种基于结构概要的数据恢复方法,包括:分析XML文档树数据,计算XML文档树叶节点对应的数据信息,并将所述叶节点数据信息进行存储和索引;将XPath查询语句解析成Twig模式树,分解模式树拆分的简单路径,并标注感兴趣的模式节点集;记录感兴趣的模式节点序列集,并进行模式节点序列的合并;根据记录的感兴趣的模式节点序列集,恢复与感兴趣的模式节点序列集相匹配的数据节点集。本发明利用XML数据结构摘要信息和基于路径的索引,在索引匹配与选取的过程中,恢复所需要的数据。从数据恢复范围和数据恢复时机这两方面对现有的方法进行了改进,可以正确、高效、准确地恢复所需要的数据,避免现有方法不准确,产生冗余等缺点。
申请公布号 CN103136378B 申请公布日期 2016.04.20
申请号 CN201310100931.4 申请日期 2013.03.27
申请人 同方知网(北京)技术有限公司 发明人 陈琳;陈海涛;夏冬;王奎
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京天奇智新知识产权代理有限公司 11340 代理人 刘黎明
主权项 一种基于结构概要的数据恢复方法,其特征在于,所述方法包括:分析XML文档树数据,计算XML文档树叶节点对应的数据信息,并将所述叶节点数据信息进行存储和索引;将XPath查询语句解析成Twig模式树,分解模式树拆分的简单路径,并标注感兴趣的模式节点集;记录感兴趣的模式节点序列集,并进行模式节点序列的合并;利用导航式路径匹配方式,在结构概要上进行匹配,寻找目标节点,并在此过程中,记录下匹配上的感兴趣的节点序列集合;根据记录的感兴趣的模式节点序列集,恢复与感兴趣的模式节点序列集相匹配的数据节点集;这个确定索引路径的过程,准确地反应出每个节点的匹配过程,可以用来判断某个节点是经过哪些节点到达根节点的,这个确认的过程,对于每个节点都是唯一的,从而可以准确地恢复任意需要的数据;如果感兴趣的模式节点是所有模式路径上的节点,则全部恢复;如果感兴趣的模式节点只是分支节点,只恢复其对应的数据节点即可;所述每条简单路径分别对应一个模式节点序列;感兴趣的模式节点包括Twig模式树的分支节点、叶子节点、Twig算法中进行位置计数的节点及返回节点。
地址 100084 北京市海淀区清华园清华大学36区华业大厦B1410、1412、1414室