发明名称 |
数据挖掘方法和数据挖掘系统 |
摘要 |
本发明公开了数据挖掘方法及数据挖掘系统,本发明方法包括:设置数据挖掘的工作流,所述工作流中包括多个并行的数据处理任务;启动所述工作流,并在所述多个并行的数据处理任务被触发时,为其中的每个数据处理任务分配执行节点,以使所述多个并行的数据处理任务在分配的执行节点上并行执行;以及,所述执行节点在执行每个数据处理任务时,通过Map/Reduce机制将数据处理任务分配给并行执行的Map任务进行处理,将该数据处理任务对应的各Map任务的处理结果通过相应的Reduce任务进行合并处理得到相应数据处理任务的处理结果。采用本发明,可提高数据挖掘效率。 |
申请公布号 |
CN101799809B |
申请公布日期 |
2011.12.14 |
申请号 |
CN200910077661.3 |
申请日期 |
2009.02.10 |
申请人 |
中国移动通信集团公司 |
发明人 |
徐萌;邓超;高丹;罗治国;周文辉;郑诗豪;沈亚飞;陈磊 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京同达信恒知识产权代理有限公司 11291 |
代理人 |
魏杉 |
主权项 |
一种数据挖掘方法,其特征在于,包括:设置数据挖掘的工作流,所述工作流中包括多个并行的数据处理任务;启动所述工作流,并在所述多个并行的数据处理任务被触发时,为其中的每个数据处理任务分配执行节点,以使所述多个并行的数据处理任务在分配的执行节点上并行执行;以及所述执行节点在执行每个数据处理任务时,通过映射Map/简化Reduce机制将数据处理任务分配给并行执行的Map任务进行处理,将该数据处理任务对应的各Map任务的处理结果通过相应的Reduce任务进行合并处理得到相应数据处理任务的处理结果。 |
地址 |
100032 北京市西城区金融大街29号 |