发明名称 一种Spark平台性能自动优化方法
摘要 本发明公开了一种Spark平台性能自动优化方法。本方法为:1)根据Spark平台的执行机制创建一Spark应用性能模型;2)针对一设定的Spark应用,选取该Spark应用的部分数据负载在该Spark平台上运行,采集Spark应用运行时的性能数据;3)将采集的性能数据输入Spark应用性能模型,得到运行该Spark应用时Spark应用性能模型中各参数的取值;4)将步骤3)获得的性能模型各参数值赋给Spark应用性能模型,计算Spark平台在不同配置参数组合时的性能(应用总执行时间),然后输出Spark平台性能最优时的配置参数组合。本发明具有低门槛、易于扩展、成本低和效率高等优点。
申请公布号 CN105868019A 申请公布日期 2016.08.17
申请号 CN201610068611.9 申请日期 2016.02.01
申请人 中国科学院大学 发明人 王国路;徐俊刚;刘仁峰
分类号 G06F9/50(2006.01)I;G06Q10/04(2012.01)I 主分类号 G06F9/50(2006.01)I
代理机构 北京君尚知识产权代理事务所(普通合伙) 11200 代理人 司立彬
主权项 一种Spark平台性能自动优化方法,其步骤为:1)根据Spark平台的执行机制创建一Spark应用性能模型;2)针对一设定的Spark应用,选取该Spark应用的部分数据负载在该Spark平台上运行,采集Spark应用运行时的性能数据;3)将采集的性能数据输入Spark应用性能模型,得到运行该Spark应用时Spark应用性能模型中各参数的取值;4)将步骤3)获得的性能模型各参数值赋给Spark应用性能模型,计算Spark平台在不同配置参数组合时的性能,然后输出Spark平台性能最优时的配置参数组合。
地址 100049 北京市石景山区玉泉路19号(甲)