发明名称 |
一种基于flume系统的数据处理方法及其装置 |
摘要 |
本发明公开了一种基于flume系统的数据处理方法及其装置,该方法应用于数据清洗系统,包括如下步骤:S1、source层从数据源采集原始数据;S2、source层将采集到的原始数据发送至channel层;S3、channel层将原始数据发送至数据清洗模块;S4、channel层从数据清洗模块获取目标数据;S5、sink层从channel层获取目标数据;S6、sink层将目标数据发送至接收方。本发明的优点在于通过将flume系统的在source层中的清洗功能剥离至flume系统外的数据清洗模块中,提高source层的数据采集效率,减少了对生产机器的损耗。 |
申请公布号 |
CN106250410A |
申请公布日期 |
2016.12.21 |
申请号 |
CN201610581729.1 |
申请日期 |
2016.07.21 |
申请人 |
广州安望信息科技有限公司 |
发明人 |
徐沛 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
广州市越秀区哲力专利商标事务所(普通合伙) 44288 |
代理人 |
陈振楔;李悦 |
主权项 |
一种基于flume系统的数据处理方法,应用于数据清洗系统,其特征在于,包括如下步骤:S1、source层从数据源采集原始数据;S2、source层将采集到的原始数据发送至channel层;S3、channel层将原始数据发送至数据清洗模块;S4、channel层从数据清洗模块获取目标数据;S5、sink层从channel层获取目标数据;S6、sink层将目标数据发送至接收方。 |
地址 |
510000 广东省广州市天河区体育东路122号之二3304室 |