发明名称 一种在计算机集群上进行矩阵乘积运算的方法和系统
摘要 本发明提供了一种在计算机集群上进行矩阵乘积运算的方法和装置,所述计算机集群上部署有分布式文件系统、用来执行映射Map任务和化简Reduce任务的多个计算节点,其中的方法具体包括:在所述多个计算节点上执行第一Map任务、第一Reduce任务、第二Map任务和第二Reduce任务;其中,所述第一Map任务进行第一处理得到相应的第一键值对结果;所述第一Reduce任务对第一键值对结果中相同主键的键值进行聚合;第二Map任务识别得到第一矩阵和第二矩阵的元素,并进行两两组合求乘积运算,得到第二键值对结果;第二Reduce任务对所述第二键值对结果中相同主键的键值进行求和。本发明能够提高矩阵乘积的运算速度。
申请公布号 CN102831102A 申请公布日期 2012.12.19
申请号 CN201210266940.6 申请日期 2012.07.30
申请人 北京亿赞普网络技术有限公司 发明人 张一凡;张中峰;罗峰;黄苏支;李娜
分类号 G06F17/16(2006.01)I;G06F9/46(2006.01)I 主分类号 G06F17/16(2006.01)I
代理机构 北京润泽恒知识产权代理有限公司 11319 代理人 苏培华
主权项 一种在计算机集群上进行矩阵乘积运算的方法,所述计算机集群上部署有分布式文件系统、用来执行映射Map任务和化简Reduce任务的多个计算节点,其特征在于,所述方法包括:在所述多个计算节点上执行第一Map任务、第一Reduce任务、第二Map任务和第二Reduce任务;其中,所述第一Map任务从分布式文件系统读取第一矩阵和第二矩阵的行数据,并对所述行数据进行第一处理得到相应的第一键值对结果,并输出;所述第一Reduce任务对所述第一键值对结果中相同主键的键值进行聚合,并将相应的聚合结果输出至分布式文件系统;所述第二Map任务从分布式文件系统读取所述聚合结果,从所述聚合结果中识别得到第一矩阵和第二矩阵的元素,并对所述第一矩阵和第二矩阵的元素进行两两组合求乘积运算,将运算得到的第二键值对结果进行输出;其中,所述第二键值对结果的主键为乘积矩阵元素的行列号,键值为乘积矩阵元素的值;所述第二Reduce任务对所述第二键值对结果中相同主键的键值进行求和,并将相应的求和结果作为乘积矩阵元素的值输出至分布式文件系统。
地址 100081 北京市海淀区中关村南大街甲18号院2号楼1607