发明名称 |
一种数据处理方法及系统 |
摘要 |
本申请公开了一种数据处理方法及系统,所述方法包括:从数据源采集原始数据,并对所述原始数据进行数据清洗;将所述清洗之后的原始数据,输入到spark平台下的转换模块,以利用所述转换模块内置的数据转换机制进行数据转换,得到样本数据;将所述样本数据,输入到spark平台下的测算模块,以利用所述测算模块内置的训练算法进行数据训练,得到逻辑回归模型。 |
申请公布号 |
CN105468770A |
申请公布日期 |
2016.04.06 |
申请号 |
CN201510900399.3 |
申请日期 |
2015.12.09 |
申请人 |
合一网络技术(北京)有限公司 |
发明人 |
雷龙艳;章岑;杨田;周盛;潘柏宇;王冀 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京市天玺沐泽专利代理事务所(普通合伙) 11532 |
代理人 |
鲍晓 |
主权项 |
一种数据处理方法,其特征在于,所述方法包括:从数据源采集原始数据,并对所述原始数据进行数据清洗;将所述清洗之后的原始数据,输入到spark平台下的转换模块,以利用所述转换模块内置的数据转换机制进行数据转换,得到样本数据;将所述样本数据,输入到spark平台下的测算模块,以利用所述测算模块内置的训练算法进行数据训练,得到逻辑回归模型。 |
地址 |
100080 北京市海淀区海淀大街8号中钢国际广场A座5层A、C区 |