发明名称 | 一种基于流感病毒刺激的细胞差异基因数据分类系统 | ||
摘要 | 本发明涉及一种基于流感病毒刺激的细胞差异基因数据分类系统,它包括数据处理模块,数据处理模块采集训练样本集数据,依据训练样本集中每个样本的基因数据进行多因素数据分割生成二次数据;数据分类模块读取数据处理模块生成的二次数据,进行数据分类计算,并将计算结果传输至模型建立模块内建立各数据分类模型;测试数据模块用于接收模型建立模块建立的各数据分类模型以及经数据处理模块处理后的待测样本集数据,测试数据模块对接收到的各数据分类模型进行评价;待测样本集数据经数据处理模块处理后生成的二次数据与评价后的各数据分类模型做比较,得到系统预测的差异表达基因的分类。本发明可以广泛在数据挖掘系统中应用。 | ||
申请公布号 | CN104063459A | 申请公布日期 | 2014.09.24 |
申请号 | CN201410294369.8 | 申请日期 | 2014.06.26 |
申请人 | 中国科学院微生物研究所 | 发明人 | 刘文军;李晶;孙清岚;马俊才 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 北京纪凯知识产权代理有限公司 11245 | 代理人 | 徐宁;孙楠 |
主权项 | 一种基于流感病毒刺激的细胞差异基因数据分类系统,其特征在于:它包括数据处理模块、数据分类模块、模型建立模块和测试数据模块;所述数据处理模块采集训练样本集数据,然后依据训练样本集中每个样本的基因数据进行多因素数据分割生成二次数据;在进行数据分割的时候,如果当某样本的基因数据存在缺失值,所述数据处理模块会将此样本单独标记;如果存在缺失值样本比率大于1/2,或缺失值比率超过预先设定的阈值,所述数据处理模块报警,样本将被剔除,申请新样本;所述数据分类模块读取所述数据处理模块生成的二次数据,进行数据分类计算,并将计算结果传输至所述模型建立模块内建立各数据分类模型;所述测试数据模块用于接收所述模型建立模块建立的各数据分类模型以及经所述数据处理模块处理后的待测样本集数据,所述测试数据模块对接收到的各数据分类模型进行评价;待测样本集数据经所述数据处理模块处理后生成的二次数据与评价后的各数据分类模型做比较,得到系统预测的差异表达基因的分类。 | ||
地址 | 100101 北京市朝阳区北辰西路1号院3号 |