XML文档的聚类方法和系统,申请号CN200410078263.0-传众专利搜索

发明名称	XML文档的聚类方法和系统
摘要	本发明公开了用于XML文档的聚类的方法和系统。所述方法在指定的存储器使用限制下操作。该系统实现该方法，并且扫描XML文档，根据应用工作负荷指派边权重，将XML节点的聚类映射到盘页面，所有这些均在分析器控制的对XML数据的单遍处理中完成。应用工作负荷信息被用于产生导致大大降低所考虑的工作负荷的缺页情况的XML聚类方案。本发明公开了用于表示工作负荷信息的若干方案。例如，工作负荷可以列出在应用期间调用的XPath操作符，以及其调用频率。通过引入例如查询重要性或查询编译代价的附加特性，能够进一步细化应用工作负荷。使用随机方案也能够模拟XML访问模式。
申请公布号	CN100405364C	申请公布日期	2008.07.23
申请号	CN200410078263.0	申请日期	2004.09.21
申请人	国际商业机器公司	发明人	R·博尔达维卡尔;S·K·帕德马纳班;O·什穆埃利
分类号	G06F17/30(2006.01)	主分类号	G06F17/30(2006.01)
代理机构	北京市中咨律师事务所	代理人	于静;杨晓光
主权项	1.一种用于对XML文档进行聚类的系统，该系统包括：用于按节点分析XML文档的装置；用于初始化至少一个所分析的节点的装置；用于对至少一个所分析的节点进行分区的装置；以及用于对至少一个所分析的节点进行处理的装置；其中用于初始化至少一个所分析的节点的装置包括：用于针对至少一个所分析的节点创建至少一个树节点的装置；用于提供关于至少一个所分析的节点的XML工作负荷信息的装置；用于当所分析的节点是父节点时提供至少一个父/子链接并且指派边权重的装置；用于当所分析的节点不是父节点时指定所分析的节点为树的根的装置；用于创建分区的装置；以及用于将所创建的分区添加到已创建分区的列表的装置。
地址	美国纽约