发明名称 |
一种分布式数据挖掘模型评估的方法与系统 |
摘要 |
本发明提供一种分布式数据挖掘模型评估的方法与系统。所述方法包括:S1,利用特定评估指标集生成模型评估模块;S2,基于评估数据集,利用所述模型评估模块以分布式策略对至少一个数据挖掘模型进行评估。本发明基于Spark分布式内存计算技术实现各类算法评估指标,形成评估指标库,使用流程化方式对一个或多个算法进行评估。所述模型评估节点作为流程化评估的节点,可以在一次评估重复多次使用,因而也可以实现对算法的重复多次模型评估和多模型同步分析,通过评估指标表及增益图和提升图对评估结果进行显示,帮助选择满足各种分类数据挖掘条件的最佳数据挖掘模型。 |
申请公布号 |
CN106599230A |
申请公布日期 |
2017.04.26 |
申请号 |
CN201611179166.X |
申请日期 |
2016.12.19 |
申请人 |
北京天元创新科技有限公司 |
发明人 |
娄海凤;张立军 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京路浩知识产权代理有限公司 11002 |
代理人 |
汤财宝 |
主权项 |
一种分布式数据挖掘模型评估的方法,其特征在于,包括:S1,利用特定评估指标集生成模型评估模块;S2,基于评估数据集,利用所述模型评估模块以分布式策略对至少一个数据挖掘模型进行评估。 |
地址 |
100193 北京市海淀区西北旺东路10号院20号楼浪潮大厦 |