发明名称 | 一种基于ETL的文件处理方法及系统 | ||
摘要 | 本申请实施例提供了一种基于ETL的文件处理方法及系统,其中所述方法包括:从源端获取多个文件对象;针对每个文件对象,进行文件内的数据切分,得到多个文本数据块;当所述多个文件对象切分完成后,将所述多个文件对象对应的所有文本数据块并发写入目的端。本发明可以提高ETL过程中文件同步的速度,最大化数据同步效率。 | ||
申请公布号 | CN106469152A | 申请公布日期 | 2017.03.01 |
申请号 | CN201510502163.4 | 申请日期 | 2015.08.14 |
申请人 | 阿里巴巴集团控股有限公司 | 发明人 | 罗海伟;陈守元 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 北京润泽恒知识产权代理有限公司 11319 | 代理人 | 赵娟 |
主权项 | 一种基于ETL的文件处理方法,其特征在于,所述的方法包括:从源端获取多个文件对象;针对每个文件对象,进行文件内的数据切分,得到多个文本数据块;当所述多个文件对象切分完成后,将所述多个文件对象对应的所有文本数据块并发写入目的端。 | ||
地址 | 英属开曼群岛大开曼资本大厦一座四层847号邮箱 |