发明名称 分布式计算框架和分布式计算方法
摘要 本申请公开了分布式计算框架和分布式计算方法。该分布式计算框架的一具体实施方式包括:解析单元,用于解析分布式计算任务的表达式,确定算子、算子对应的字段;算子单元,用于提供算子,算子的输入参数包括:字段、字段型分布式数据集。实现了任意算子接收和返回的参数的类型均可以为字段型分布式数据集,任意算子均可对字段型分布式数据集中的对应于字段的数据进行操作。从而,任意算子均需实现一次,实现算子的复用。将分布式计算任务以较为简单的表达式显示地表达出来,简化了用户利用的分布式计算框架编写分布式计算程序的复杂度,进一步地,可以通过表达式确定分布式计算中涉及的算子,从而可以对分布式计算过程进行优化。
申请公布号 CN106406985A 申请公布日期 2017.02.15
申请号 CN201610836654.7 申请日期 2016.09.21
申请人 北京百度网讯科技有限公司 发明人 张建伟;张云聪;王聪;徐瑶;文春阳;黄鑫;宋展;朱冠胤
分类号 G06F9/46(2006.01)I 主分类号 G06F9/46(2006.01)I
代理机构 北京英赛嘉华知识产权代理有限责任公司 11204 代理人 王达佐;马晓亚
主权项 一种分布式计算框架,其特征在于,所述分布式计算框架包括:解析单元,用于解析分布式计算任务的表达式,确定算子、所述算子对应的字段,其中,所述字段指示算子作用于的分布式数据集中的数据的属性;算子单元,用于提供算子,所述算子的输入参数包括:字段、字段型分布式数据集,其中,所述字段型分布式数据集包含至少一个元素,所述元素包含多个键值对,键值对的键为字段,值为分布式数据集中对应于所述字段的数据。
地址 100085 北京市海淀区上地十街10号百度大厦2层