发明名称 在具有存储网络的数据中心进行MapReduce数据传输的方法和系统
摘要 本发明公开一种在具有存储网络(SAN)的数据中心进行MapReduce数据传输的方法,该数据中心包括部署有作业服务器、Map任务服务器和Reduce任务服务器的多台服务器,该方法包括:响应于接收到作业服务器分配的Map任务,Map任务服务器执行Map任务并产生Map任务输出结果;Map任务服务器将Map任务输出结果写入存储网络;以及响应于接收到作业服务器分配的Reduce任务,Reduce任务服务器从存储网络读取Map任务输出结果。
申请公布号 CN102209087B 申请公布日期 2014.07.09
申请号 CN201010138992.6 申请日期 2010.03.31
申请人 国际商业机器公司 发明人 薛伟;蔡斌;向哲;杨博;李立
分类号 H04L29/08(2006.01)I 主分类号 H04L29/08(2006.01)I
代理机构 北京市中咨律师事务所 11247 代理人 于静;杨晓光
主权项 一种用于在具有存储网络SAN的数据中心进行MapReduce数据传输的方法,该数据中心包括部署有作业服务器、Map任务服务器和Reduce任务服务器的多台服务器,该方法包括:响应于接收到作业服务器分配的Map任务,Map任务服务器执行Map任务并产生Map任务输出结果,包括:响应于接收到作业服务器分配的Map任务,从作业服务器指定的存储位置读取Map任务的输入数据分片;从输入数据分片中分析出键值对;调用Map函数对所述键值对进行计算并产生Map函数的输出;以及通过对Map函数的输出做分割形成Map任务输出结果;Map任务服务器将Map任务输出结果写入存储网络SAN;以及响应于接收到作业服务器分配的Reduce任务,Reduce任务服务器从存储网络SAN读取Map任务输出结果。
地址 美国纽约