发明名称 |
数据处理方法及装置 |
摘要 |
本发明实施例提供一种数据处理方法及装置,所述方法包括:获取输入数据,所述数据包括结构化数据、半结构化数据或者非结构化数据;若输入数据为结构化数据或半结构化数据,采用HDFS分布式文件系统进行存储并进行数据建模;若输入数据为非结构化数据,则采用mooseFS分布式文件系统进行存储。所述方法解决了在Hadoop中的HDFS无法很有效的处理大量的小文件和Hadoop的MapReduce处理小文件会产生极大的资源浪费问题。 |
申请公布号 |
CN106294805A |
申请公布日期 |
2017.01.04 |
申请号 |
CN201610671912.0 |
申请日期 |
2016.08.15 |
申请人 |
成都九鼎瑞信科技股份有限公司 |
发明人 |
李存昌;蒋松 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京超凡志成知识产权代理事务所(普通合伙) 11371 |
代理人 |
马维丽 |
主权项 |
一种数据处理方法,其特征在于,所述方法包括:获取输入数据,所述数据包括结构化数据、半结构化数据或者非结构化数据;若输入数据为结构化数据或半结构化数据,采用HDFS分布式文件系统进行存储并进行数据建模;若输入数据为非结构化数据,则采用mooseFS分布式文件系统进行存储。 |
地址 |
610000 四川省成都市高新区府城大道西段399号5栋1单元13层9-12号 |