发明名称 |
在具有存储网络的数据中心进行MapReduce数据传输的方法和系统 |
摘要 |
本发明公开一种在具有存储网络(SAN)的数据中心进行MapReduce数据传输的方法,该数据中心包括部署有作业服务器、Map任务服务器和Reduce任务服务器的多台服务器,该方法包括:响应于接收到作业服务器分配的Map任务,Map任务服务器执行Map任务并产生Map任务输出结果;Map任务服务器将Map任务输出结果写入存储网络;以及响应于接收到作业服务器分配的Reduce任务,Reduce任务服务器从存储网络读取Map任务输出结果。 |
申请公布号 |
CN102209087B |
申请公布日期 |
2014.07.09 |
申请号 |
CN201010138992.6 |
申请日期 |
2010.03.31 |
申请人 |
国际商业机器公司 |
发明人 |
薛伟;蔡斌;向哲;杨博;李立 |
分类号 |
H04L29/08(2006.01)I |
主分类号 |
H04L29/08(2006.01)I |
代理机构 |
北京市中咨律师事务所 11247 |
代理人 |
于静;杨晓光 |
主权项 |
一种用于在具有存储网络SAN的数据中心进行MapReduce数据传输的方法,该数据中心包括部署有作业服务器、Map任务服务器和Reduce任务服务器的多台服务器,该方法包括:响应于接收到作业服务器分配的Map任务,Map任务服务器执行Map任务并产生Map任务输出结果,包括:响应于接收到作业服务器分配的Map任务,从作业服务器指定的存储位置读取Map任务的输入数据分片;从输入数据分片中分析出键值对;调用Map函数对所述键值对进行计算并产生Map函数的输出;以及通过对Map函数的输出做分割形成Map任务输出结果;Map任务服务器将Map任务输出结果写入存储网络SAN;以及响应于接收到作业服务器分配的Reduce任务,Reduce任务服务器从存储网络SAN读取Map任务输出结果。 |
地址 |
美国纽约 |