发明名称 |
一种互联网环境下大数据分类预处理方法及系统 |
摘要 |
本发明涉及一种大数据分类预处理方法及系统,特别涉及一种互联网环境下大数据分类预处理方法,属于数据挖掘领域。本发明采用互联网中多类别的网络数据组成较完备的预处理的基础数据集,先通过降维等操作,实现数据的精简;然后通过对该数据集中不同类型数据分别进行分析和预处理,得到用于分类的数据集,为实现进一步的分类做好数据准备。 |
申请公布号 |
CN106055557A |
申请公布日期 |
2016.10.26 |
申请号 |
CN201610308773.5 |
申请日期 |
2016.05.12 |
申请人 |
中国科学技术信息研究所 |
发明人 |
张晓丹;梁冰;王莉;白海燕 |
分类号 |
G06F17/30(2006.01)I;G06K9/62(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
|
代理人 |
|
主权项 |
一种互联网环境下大数据分类预处理方法,其特征在于:其包括以下操作步骤:步骤一、互联网环境下大数据分类预处理方法的数据获取;对互联网中不同类型的网络数据进行采集,并进行降维处理;步骤二、互联网环境下大数据分类预处理方法的预处理,形成系统可以直接处理的数据;所述预处理包括除噪。 |
地址 |
100038 北京市海淀区复兴路15号 |