发明名称 |
分布式数据处理方法、装置及系统 |
摘要 |
本发明实施例提供一种分布式数据处理方法、装置及系统,该分布式数据处理方法包括:根据获取到的上传节点指示信息和工作节点发送的任务获取请求生成映射Map任务,其中,上传节点指示信息包括多个数据块分别对应的工作节点的地址,Map任务对应的数据块分布在发送任务获取请求的工作节点上;将Map任务分配给工作节点,以使工作节点对Map任务对应的数据块进行相应地处理。本发明实施例提供的分布式数据处理方法、装置及系统,避免了分布式数据处理过程中各工作节点间的数据迁移造成的网络流量大的问题,也避免了磁盘读写所占用的系统资源,提高系统的分布式数据处理效果。 |
申请公布号 |
CN103324533B |
申请公布日期 |
2016.12.28 |
申请号 |
CN201210077763.7 |
申请日期 |
2012.03.22 |
申请人 |
华为技术有限公司 |
发明人 |
钱剑锋;颜友亮 |
分类号 |
G06F9/50(2006.01)I |
主分类号 |
G06F9/50(2006.01)I |
代理机构 |
北京同立钧成知识产权代理有限公司 11205 |
代理人 |
刘芳 |
主权项 |
一种分布式数据处理方法,其特征在于,包括:根据获取到的上传节点指示信息和工作节点发送的任务获取请求生成映射Map任务,其中,所述上传节点指示信息包括多个数据块分别对应的工作节点的地址,所述Map任务对应的数据块分布在发送所述任务获取请求的工作节点上;将所述Map任务分配给所述工作节点,以使所述工作节点对所述Map任务对应的数据块进行相应地处理;所述根据获取到的上传节点指示信息和工作节点发送的任务获取请求生成映射Map任务之前,还包括:根据客户端发送文件信息,生成文件划分指示信息和所述上传节点指示信息,将所述文件划分指示信息和所述上传节点指示信息发送给所述客户端,以使所述客户端根据所述文件划分指示信息将待处理文件划分为多个所述数据块,根据所述上传节点指示信息将各所述数据块分别发送给对应的工作节点;所述根据获取到的上传节点指示信息和工作节点发送的任务获取请求生成映射Map任务,包括:当接收到所述工作节点发送的任务获取请求时,根据所述上传节点指示信息确定发送给所述工作节点的数据块,获取所述工作节点对应的数据块的处理状态;根据所述处理状态为未处理的数据块生成所述Map任务,将所述Map任务对应的数据块的处理状态更改为已处理。 |
地址 |
518129 广东省深圳市龙岗区坂田华为总部办公楼 |