发明名称 一种基于函数依赖关系的OLAP分组聚集方法
摘要 本发明涉及一种基于函数依赖关系的OLAP分组聚集方法,其步骤:定义分组属性间的函数依赖树结构,确定分组属性及表间属性之间的函数依赖关系;对GROUP BY子句的分组属性按分组属性函数依赖树进行检测;将查询分组属性划分为两个分组,分别由函数依赖键属性和其他分组属性组成;对维表按函数依赖关系进行模式分解,维表使用代理键机制,采用内存列存储机制;在维表模式分解和代理键索引机制下,分组聚集计算进一步将分组属性转换为对函数依赖键属性的分组聚集计算,在完成分组聚集计算后,按函数依赖键属性值直接映射到相关维表记录的内存偏移地址,完成抽取其他相关分组属性的操作,输出完整的SQL查询结果。本发明能约简分组属性大小,提高哈希分组计算效率的作用。
申请公布号 CN105930388A 申请公布日期 2016.09.07
申请号 CN201610232371.1 申请日期 2016.04.14
申请人 中国人民大学 发明人 张延松;张宇;周烜;王珊
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京纪凯知识产权代理有限公司 11245 代理人 徐宁;孙楠
主权项 一种基于函数依赖关系的OLAP分组聚集方法,其特征在于,该方法包括以下步骤:1)根据数据仓库模式及参照完整性约束条件定义分组属性间的函数依赖树结构,确定数据仓库各个表中分组属性及表间属性之间的函数依赖关系;2)查询执行时,对GROUP BY子句的分组属性按分组属性函数依赖树进行检测,确定其中包含的函数依赖属性集,以及各函数依赖属性组中的键属性;3)将查询分组属性划分为两个分组,分别由函数依赖键属性和查询中键属性之外的其他分组属性组成,函数依赖键属性作为主要哈希键值属性进行哈希分组探测,其他分组属性作为附加属性存储但不参与哈希键映射计算;4)对维表按函数依赖关系进行模式分解,确保每个表只存在一个函数依赖关系,表间记录的函数依赖关系由主‑外键参照完整性约束条件来定义,维表使用代理键机制,采用内存列存储机制;5)在维表模式分解和代理键索引机制下,分组聚集计算进一步将分组属性转换为对函数依赖键属性的分组聚集计算,在完成分组聚集计算后,按函数依赖键属性值直接映射到相关维表记录的内存偏移地址,完成抽取其他相关分组属性的操作,输出完整的SQL查询结果。
地址 100872 北京市海淀区中关村大街59号中国人民大学明德商学楼110室