发明名称 一种数据处理方法及系统
摘要 本申请公开了一种数据处理方法及系统,所述方法包括:从数据源采集原始数据,并对所述原始数据进行数据清洗;将所述清洗之后的原始数据,输入到spark平台下的转换模块,以利用所述转换模块内置的数据转换机制进行数据转换,得到样本数据;将所述样本数据,输入到spark平台下的测算模块,以利用所述测算模块内置的训练算法进行数据训练,得到逻辑回归模型。
申请公布号 CN105468770A 申请公布日期 2016.04.06
申请号 CN201510900399.3 申请日期 2015.12.09
申请人 合一网络技术(北京)有限公司 发明人 雷龙艳;章岑;杨田;周盛;潘柏宇;王冀
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京市天玺沐泽专利代理事务所(普通合伙) 11532 代理人 鲍晓
主权项 一种数据处理方法,其特征在于,所述方法包括:从数据源采集原始数据,并对所述原始数据进行数据清洗;将所述清洗之后的原始数据,输入到spark平台下的转换模块,以利用所述转换模块内置的数据转换机制进行数据转换,得到样本数据;将所述样本数据,输入到spark平台下的测算模块,以利用所述测算模块内置的训练算法进行数据训练,得到逻辑回归模型。
地址 100080 北京市海淀区海淀大街8号中钢国际广场A座5层A、C区