发明名称 |
基于序列模式的数据导入及查询方法 |
摘要 |
一种基于序列模式的数据导入方法包括:A.对当前需要存储的文档进行解析,识别出来哪些数据表示元素节点,哪些数据表示元素节点对应的值;B.构建编码和元素之间的一一对应关系;C.构建和文档元素对应的编码序列;D.将构建好的序列组织为B+树的形式存于磁盘上,同时构建元素和其值对应的关系表,并存于数据库中。此外,一种序列模式的数据查询方法包括:A.对于用户提交的查询进行解析,识别出查询节点之间的约束关系以及其他谓词关系;B.系统根据特定的算法将该查询转化为序列;C.根据特定的序列匹配算法,从原文档对应的序列中找与用户查询等价的序列匹配的文档片断;D.将匹配的结果返回给用户。 |
申请公布号 |
CN101216852A |
申请公布日期 |
2008.07.09 |
申请号 |
CN200810056100.0 |
申请日期 |
2008.01.11 |
申请人 |
孟小峰 |
发明人 |
孟小峰;蒋瑜 |
分类号 |
G06F17/30(2006.01) |
主分类号 |
G06F17/30(2006.01) |
代理机构 |
北京中创阳光知识产权代理有限责任公司 |
代理人 |
尹振启 |
主权项 |
1.一种基于序列模式的数据导入方法,包括:A、对于当前需要存储的文档,首先需要对其进行解析,识别出来哪些数据表示元素节点,哪些数据表示元素节点对应的值;B、对于识别出来的元素节点进行编码,构建编码和元素之间的一一对应关系;C、构建和文档元素对应的编码序列,这个序列和原文档之间具有相互对应关系,可以根据序列重新构建原文档;D、将构建好的序列组织为B+树的形式存于磁盘上,同时构建元素和其值对应的关系表,并存于数据库中。 |
地址 |
100872北京市海淀区海淀路39号人民大学信息学院 |