发明名称 一种基于统计判别法对电商销售额异常值的预处理方法
摘要 本发明公开了一种基于统计判别法对电商销售额异常值的预处理方法,该预处理方法步骤如下:完善数据挖掘技术和工具;对基础数据的进行初步验证;对异常值进行分类;加强与虚假信息库的对比剔除,减少缺失、噪音数据,对于确实为缺失数据的对其补零处理;对于虚假数据判别验证;对于刷单数据进行验证处理;数据采集过程中,将采集结果与异常数据库进行对比;形成海量的数据库之后,建立基本的信息库,对海量数据批量处理。本发明和现有技术相比,对异常电商数据更有针对性,对异常电商数据的排查将使采集周期变短、数据准确性大大提高,而且操作简单,节省了客户查阅资料的时间。
申请公布号 CN104657503A 申请公布日期 2015.05.27
申请号 CN201510109629.4 申请日期 2015.03.13
申请人 浪潮集团有限公司 发明人 左少标;贾亦真;张鑫;徐宏伟
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 济南信达专利事务所有限公司 37100 代理人 姜明
主权项 一种基于统计判别法对电商销售额异常值的预处理方法,其特征在于,该预处理方法步骤如下:步骤1:完善数据挖掘技术和工具;步骤2:对基础数据的进行初步验证,找出异常值,非异常值纳入原始电商数据库,异常值再次进行验证处理;步骤3:对异常值进行分类;步骤4:加强与虚假信息库的对比剔除,减少缺失、噪音数据,对于确实为缺失数据的对其补零处理;步骤5:对于虚假数据,使用DDFAI对其判别验证,判别为虚假信息的纳入虚假信息库,并将其删除,非虚假信息纳入原始电商数据库;步骤6:对于刷单数据进行验证处理;步骤7:数据采集过程中,将采集结果与异常数据库进行对比,如若相同,则删掉;如若不同,继续利用上述步骤对其进行检验;步骤8:形成海量的数据库之后,建立基本的信息库,对每一个电商建立样本库,实时数据都与历史数据建模分析,实现对海量数据的批量处理。
地址 250101 山东省济南市高新区舜雅路1036号