主权项 |
一种面向多维数据管理的云计算平台查询处理方法,其特征在于包括以下步骤:步骤1构建一个云计算平台,该平台由主节点和若干从属节点组成,主节点用于发送查询,从属节点用于存储多维数据对象、接收查询并将查询结果返回给用户,主节点和从属节点由互联网连接;所述的云计算平台中的节点分为两类:主节点和从属节点,主节点负责存储全局索引和不断发送查询请求,从属节点用于存储多维数据对象和处理查询请求,当从属节点完成一个查询请求后,从主节点接收一个新的查询请求;步骤2采用IDBC算法将所有从属节点划分成多个簇,使得在相同簇中的从属节点含有相似的数据对象;步骤3为每个从属节点簇构建基于四叉树的多维索引,并将其组织在一个CAN覆盖网络中;步骤4进行查询处理;步骤2中所述的IDBC算法,包括如下步骤:步骤2‑1局部聚类在局部聚类阶段,每个从属节点Si对其数据集合Di进行分类,形成多个局部聚类,每个局部聚类Ci运用DBSCAN算法选择由定义4给出的能够反映数据分布特征的核心聚类点CC‑points,局部聚类阶段后,每个局部聚类Ci将自身的CC‑points集合被发送到主节点进行全局聚类,所述定义4如下;定义4将邻域r内所有密度可达的数据对象按照密度可达长度降序排列,邻域r的核心聚类点为具有最大密度可达长度的数据对象;步骤2‑2全局聚类在全局聚类阶段,主节点在接收到所有局部聚类的CC‑points后,使得每个局部聚类都由一些CC‑points表示,主节点运用K‑means算法产生全局聚类模型,并将聚类结果发送给从属节点集合形成多个从属节点簇;步骤2‑3聚类结果更新在聚类结果更新阶段,将步骤2‑2中的全局聚类结果发送给各个局部聚类,进行聚类结果的更新,以便从属节点将所有数据点都划分到全局聚类中;步骤3中所述的为每个从属节点簇构建基于四叉树的多维索引,按照如下步骤进行:索引结构由两层构成,一是主节点层,二是从属节点层,主节点层索引负责存储全局聚类结果的全局索引,并向从属节点簇发出查询请求,每个从属节点簇存储其自身的局部聚类索引,完成存储数据对象和处理查询的任务,采用改进的MX‑CIF四叉树结构,索引从属节点簇中的数据对象,并将此四叉树结构分布到一个CAN覆盖网络中;查询处理从四叉树的根节点开始,通过判断数据对象和查询的交叉区域将查询沿着四叉 树的某些分支继续进行查询,在从属节点簇中,如果所有的查询处理都从四叉树的根节点开始会导致根节点失效,因此,提出最小划分层次dmin和最大划分层次dmax的概念,dmin表示数据对象仅能存储在L≥dmin层次,即在0<L<dmin层次并不存储数据对象;四叉树的每个分块由其几何中心唯一标识,称为控制点,以下过程表示确定与某个数据对象相交的控制点集合:(1)如果某个数据对象o所在四叉树子块b的划分层次为dmin,则(2)依次判断数据对象o所在的四叉树子块b的四个孩子块(3)如果至少两个孩子块范围与o相交或者当前划分层次达到dmax,则(4)将数据对象o所在的四叉树子块b的控制点m加入到控制点集合中,(5)否则(6)划分层次L加1,继续循环划分;将四叉树索引结构分布到一个CAN覆盖网络中。 |