发明名称 一种面向多维数据管理的云计算平台查询处理方法
摘要 一种面向多维数据管理的云计算平台查询处理方法,属于数据库领域,该方法包括以下步骤:步骤1构建一个云计算平台,该平台由主节点和若干从属节点组成,主节点用于发送查询,从属节点用于存储多维数据对象、接收查询并将查询结果返回给用户,主节点和从属节点由互联网连接;步骤2采用IDBC算法将所有从属节点划分成多个簇,使得在相同簇中的从属节点含有相似的数据对象;步骤3为每个从属节点簇构建基于四叉树的多维索引,并将其组织在一个CAN覆盖网络中;步骤4进行查询处理。
申请公布号 CN102063486B 申请公布日期 2013.06.05
申请号 CN201010611355.6 申请日期 2010.12.28
申请人 东北大学 发明人 王国仁;乔百友;丁琳琳;孙永佼
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 沈阳东大专利代理有限公司 21109 代理人 梁焱
主权项 一种面向多维数据管理的云计算平台查询处理方法,其特征在于包括以下步骤:步骤1构建一个云计算平台,该平台由主节点和若干从属节点组成,主节点用于发送查询,从属节点用于存储多维数据对象、接收查询并将查询结果返回给用户,主节点和从属节点由互联网连接;所述的云计算平台中的节点分为两类:主节点和从属节点,主节点负责存储全局索引和不断发送查询请求,从属节点用于存储多维数据对象和处理查询请求,当从属节点完成一个查询请求后,从主节点接收一个新的查询请求;步骤2采用IDBC算法将所有从属节点划分成多个簇,使得在相同簇中的从属节点含有相似的数据对象;步骤3为每个从属节点簇构建基于四叉树的多维索引,并将其组织在一个CAN覆盖网络中;步骤4进行查询处理;步骤2中所述的IDBC算法,包括如下步骤:步骤2‑1局部聚类在局部聚类阶段,每个从属节点Si对其数据集合Di进行分类,形成多个局部聚类,每个局部聚类Ci运用DBSCAN算法选择由定义4给出的能够反映数据分布特征的核心聚类点CC‑points,局部聚类阶段后,每个局部聚类Ci将自身的CC‑points集合被发送到主节点进行全局聚类,所述定义4如下;定义4将邻域r内所有密度可达的数据对象按照密度可达长度降序排列,邻域r的核心聚类点为具有最大密度可达长度的数据对象;步骤2‑2全局聚类在全局聚类阶段,主节点在接收到所有局部聚类的CC‑points后,使得每个局部聚类都由一些CC‑points表示,主节点运用K‑means算法产生全局聚类模型,并将聚类结果发送给从属节点集合形成多个从属节点簇;步骤2‑3聚类结果更新在聚类结果更新阶段,将步骤2‑2中的全局聚类结果发送给各个局部聚类,进行聚类结果的更新,以便从属节点将所有数据点都划分到全局聚类中;步骤3中所述的为每个从属节点簇构建基于四叉树的多维索引,按照如下步骤进行:索引结构由两层构成,一是主节点层,二是从属节点层,主节点层索引负责存储全局聚类结果的全局索引,并向从属节点簇发出查询请求,每个从属节点簇存储其自身的局部聚类索引,完成存储数据对象和处理查询的任务,采用改进的MX‑CIF四叉树结构,索引从属节点簇中的数据对象,并将此四叉树结构分布到一个CAN覆盖网络中;查询处理从四叉树的根节点开始,通过判断数据对象和查询的交叉区域将查询沿着四叉 树的某些分支继续进行查询,在从属节点簇中,如果所有的查询处理都从四叉树的根节点开始会导致根节点失效,因此,提出最小划分层次dmin和最大划分层次dmax的概念,dmin表示数据对象仅能存储在L≥dmin层次,即在0<L<dmin层次并不存储数据对象;四叉树的每个分块由其几何中心唯一标识,称为控制点,以下过程表示确定与某个数据对象相交的控制点集合:(1)如果某个数据对象o所在四叉树子块b的划分层次为dmin,则(2)依次判断数据对象o所在的四叉树子块b的四个孩子块(3)如果至少两个孩子块范围与o相交或者当前划分层次达到dmax,则(4)将数据对象o所在的四叉树子块b的控制点m加入到控制点集合中,(5)否则(6)划分层次L加1,继续循环划分;将四叉树索引结构分布到一个CAN覆盖网络中。
地址 110819 辽宁省沈阳市和平区文化路3号巷11号