发明名称 一种基因数据处理方法及装置
摘要 本发明实施例公开了一种基因数据处理方法及装置,所述方法包括:接收参考人群的指定特征类型的基因数据,对所述基因数据进行预处理得到标准化基因数据,使用LASSO方法对所述标准化基因数据进行特征基因选择,得到特征基因数据,基于交叉验证方法,将所述特征基因数据的样本集分成测试样本和训练样本,将所述训练样本注入分类器,得到训练后分类器,将所述测试样本注入所述训练后分类器,对所述测试样本进行特征分类,并统计分类器的分类准确性。本发明实施例可以提高特征基因选择的准确性、降低测试样本和训练样本的选择对分类准确率的影响。
申请公布号 CN104408332A 申请公布日期 2015.03.11
申请号 CN201410616856.1 申请日期 2014.11.05
申请人 深圳先进技术研究院 发明人 周丰丰;赵苗苗
分类号 G06F19/24(2011.01)I 主分类号 G06F19/24(2011.01)I
代理机构 广州三环专利代理有限公司 44202 代理人 郝传鑫;熊永强
主权项 一种基因数据处理方法,其特征在于,包括以下步骤:接收参考人群的样本特征类型的基因数据,基于交叉验证方法,将所述基因数据分成测试数据和训练数据;对所述基因数据进行去噪和标准化处理得到标准化基因数据;使用最小凸度绝对压缩选择算子LASSO方法对所述标准化基因数据进行特征基因选择,得到特征基因数据;将所述训练数据对应的特征基因数据注入分类器,对所述分类器进行训练,得到训练后分类器;将所述测试数据对应的特征基因数据注入所述训练后分类器,得到所述测试数据对应的特征基因数据的分类结果。
地址 518055 广东省深圳市南山区西丽大学城学苑大道1068号