发明名称 |
一种考虑任务相关性的Hive优化方法及系统 |
摘要 |
本发明涉及一种考虑任务相关性的Hive优化方法及系统,所述方法包括:将HQL语句转化为MapReduce物理计划,并获取所述MapReduce物理计划中各MapReduce Job在shuffle阶段用于排序的键shuffle key;根据相关性规则,合并所述各MapReduce Job中相关MapReduce Job;本发明提供的方法及系统,考虑Hive执行过程中,任务之间的相关性,最小化MapReduce Job数量。 |
申请公布号 |
CN106250460A |
申请公布日期 |
2016.12.21 |
申请号 |
CN201610607561.7 |
申请日期 |
2016.07.28 |
申请人 |
全球能源互联网研究院;国网上海市电力公司;国家电网公司 |
发明人 |
杨訸;李焕;赵婷;刘贺;高昆仑;袁豪;陈江琦;黄复鹏;梁潇;王宇飞 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京安博达知识产权代理有限公司 11271 |
代理人 |
徐国文 |
主权项 |
一种考虑任务相关性的Hive优化方法,其特征在于,所述方法包括:将HQL语句转化为MapReduce物理计划,并获取所述MapReduce物理计划中各MapReduce Job在shuffle阶段用于排序的键shuffle key;根据相关性规则,合并所述各MapReduce Job中相关MapReduce Job。 |
地址 |
102209 北京市昌平区未来科技城北区国网智能电网研究院院内 |