发明名称 |
数据降噪及分类方法、装置及系统 |
摘要 |
本发明提供一种数据降噪及分类方法、装置及系统,数据降噪及分类装置包括:数据管理模块,配置成导入一个或多个数据源,整合一个或多个数据源中的数据,并分为多个数据组储存在数据库中;特征生成模块,配置成生成特征库,特征库包括多个特征组,特征组按如下步骤生成:生成多个特征,每个特征对应处理一个或多个数据组,每个特征包括特征条件及一个或多个关键内容;设置多个特征之间的关系,以生成特征组,特征组包括多个特征及多个特征之间的关系;设置对应特征组的数据处理类型;数据处理模块,选择特征、特征组或特征库对储存在数据库中的数据标记噪音和/或数据分类。本发明提供的数据降噪及分类方法、装置及系统可用于海量数据处理。 |
申请公布号 |
CN105912674A |
申请公布日期 |
2016.08.31 |
申请号 |
CN201610227851.9 |
申请日期 |
2016.04.13 |
申请人 |
精硕世纪科技(北京)有限公司 |
发明人 |
李光辉 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
上海隆天律师事务所 31282 |
代理人 |
臧云霄;李峰 |
主权项 |
一种数据降噪及分类装置,其特征在于,包括:数据管理模块,配置成导入一个或多个数据源,整合所述一个或多个数据源中的数据,并分为多个数据组储存在数据库中;特征生成模块,配置成生成特征库,所述特征库包括多个特征组,所述特征组按如下步骤生成:生成多个特征,每个所述特征对应处理一个或多个数据组,每个所述特征包括特征条件及一个或多个关键内容;设置所述多个特征之间的关系,以生成所述特征组,所述特征组包括所述多个特征及所述多个特征之间的关系;设置对应所述特征组的数据处理类型;数据处理模块,选择所述特征、所述特征组或所述特征库对储存在所述数据库中的数据标记噪音和/或数据分类。 |
地址 |
100010 北京市东城区南竹杆胡同1号9层1007室 |