发明名称 |
一种用户定义函数UDF运行情况的处理方法及系统 |
摘要 |
一种用户定义函数UDF运行情况的处理方法,其能够以在线的方式自动收集UDF运行状态,定时输出数据报表,量化了UDF调用情况。该方法包括:(1)在HIVE执行计算作业时,每一个计算作业JOB包含N个任务TASK,收集计算作业的JOBID、TASKID、执行开始时间、执行人员、IP地址、作业名称、结束时间;(2)对处理数据量以及调用次数、成功次数以及失败次数做计数;(3)在TASK执行结束之前,在CLOSE方法中把步骤(1)和(2)收集到的信息持久化,存储到mysql数据库;(4)根据mysql数据库中存储的数据,定时统计分析出每一个UDF的执行状态,并输出数据报表。还有一种用户定义函数UDF运行情况的处理系统。 |
申请公布号 |
CN106547883A |
申请公布日期 |
2017.03.29 |
申请号 |
CN201610954051.7 |
申请日期 |
2016.11.03 |
申请人 |
北京集奥聚合科技有限公司 |
发明人 |
温宗臣;张翼;何良均;范卫卫;冯森林;李冰;曾攀;严亮;张书凡;张飞翔 |
分类号 |
G06F17/30(2006.01)I;G06F11/34(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京和信华成知识产权代理事务所(普通合伙) 11390 |
代理人 |
胡剑辉 |
主权项 |
一种用户定义函数UDF运行情况的处理方法,其特征在于:该方法包括以下步骤:(1)在HIVE执行计算作业时,每一个计算作业JOB包含N个任务TASK,收集计算作业的JOBID、TASKID、执行开始时间、执行人员、IP地址、作业名称、结束时间;(2)对处理数据量以及调用次数、成功次数以及失败次数做计数;(3)在TASK执行结束之前,在CLOSE方法中把步骤(1)和(2)收集到的信息持久化,存储到mysql数据库;(4)根据mysql数据库中存储的数据,定时统计分析出每一个UDF的执行状态,并输出数据报表。 |
地址 |
100085 北京市海淀区上地东路1号院5号楼9层901 |