发明名称 一种基于ETL的文件处理方法及系统
摘要 本申请实施例提供了一种基于ETL的文件处理方法及系统,其中所述方法包括:从源端获取多个文件对象;针对每个文件对象,进行文件内的数据切分,得到多个文本数据块;当所述多个文件对象切分完成后,将所述多个文件对象对应的所有文本数据块并发写入目的端。本发明可以提高ETL过程中文件同步的速度,最大化数据同步效率。
申请公布号 CN106469152A 申请公布日期 2017.03.01
申请号 CN201510502163.4 申请日期 2015.08.14
申请人 阿里巴巴集团控股有限公司 发明人 罗海伟;陈守元
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京润泽恒知识产权代理有限公司 11319 代理人 赵娟
主权项 一种基于ETL的文件处理方法,其特征在于,所述的方法包括:从源端获取多个文件对象;针对每个文件对象,进行文件内的数据切分,得到多个文本数据块;当所述多个文件对象切分完成后,将所述多个文件对象对应的所有文本数据块并发写入目的端。
地址 英属开曼群岛大开曼资本大厦一座四层847号邮箱