发明名称 数据降噪及分类方法、装置及系统
摘要 本发明提供一种数据降噪及分类方法、装置及系统,数据降噪及分类装置包括:数据管理模块,配置成导入一个或多个数据源,整合一个或多个数据源中的数据,并分为多个数据组储存在数据库中;特征生成模块,配置成生成特征库,特征库包括多个特征组,特征组按如下步骤生成:生成多个特征,每个特征对应处理一个或多个数据组,每个特征包括特征条件及一个或多个关键内容;设置多个特征之间的关系,以生成特征组,特征组包括多个特征及多个特征之间的关系;设置对应特征组的数据处理类型;数据处理模块,选择特征、特征组或特征库对储存在数据库中的数据标记噪音和/或数据分类。本发明提供的数据降噪及分类方法、装置及系统可用于海量数据处理。
申请公布号 CN105912674A 申请公布日期 2016.08.31
申请号 CN201610227851.9 申请日期 2016.04.13
申请人 精硕世纪科技(北京)有限公司 发明人 李光辉
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 上海隆天律师事务所 31282 代理人 臧云霄;李峰
主权项 一种数据降噪及分类装置,其特征在于,包括:数据管理模块,配置成导入一个或多个数据源,整合所述一个或多个数据源中的数据,并分为多个数据组储存在数据库中;特征生成模块,配置成生成特征库,所述特征库包括多个特征组,所述特征组按如下步骤生成:生成多个特征,每个所述特征对应处理一个或多个数据组,每个所述特征包括特征条件及一个或多个关键内容;设置所述多个特征之间的关系,以生成所述特征组,所述特征组包括所述多个特征及所述多个特征之间的关系;设置对应所述特征组的数据处理类型;数据处理模块,选择所述特征、所述特征组或所述特征库对储存在所述数据库中的数据标记噪音和/或数据分类。
地址 100010 北京市东城区南竹杆胡同1号9层1007室