发明名称 |
一种基因数据处理方法及装置 |
摘要 |
本发明实施例公开了一种基因数据处理方法及装置,所述方法包括:接收参考人群的指定特征类型的基因数据,对所述基因数据进行预处理得到标准化基因数据,使用LASSO方法对所述标准化基因数据进行特征基因选择,得到特征基因数据,基于交叉验证方法,将所述特征基因数据的样本集分成测试样本和训练样本,将所述训练样本注入分类器,得到训练后分类器,将所述测试样本注入所述训练后分类器,对所述测试样本进行特征分类,并统计分类器的分类准确性。本发明实施例可以提高特征基因选择的准确性、降低测试样本和训练样本的选择对分类准确率的影响。 |
申请公布号 |
CN104408332A |
申请公布日期 |
2015.03.11 |
申请号 |
CN201410616856.1 |
申请日期 |
2014.11.05 |
申请人 |
深圳先进技术研究院 |
发明人 |
周丰丰;赵苗苗 |
分类号 |
G06F19/24(2011.01)I |
主分类号 |
G06F19/24(2011.01)I |
代理机构 |
广州三环专利代理有限公司 44202 |
代理人 |
郝传鑫;熊永强 |
主权项 |
一种基因数据处理方法,其特征在于,包括以下步骤:接收参考人群的样本特征类型的基因数据,基于交叉验证方法,将所述基因数据分成测试数据和训练数据;对所述基因数据进行去噪和标准化处理得到标准化基因数据;使用最小凸度绝对压缩选择算子LASSO方法对所述标准化基因数据进行特征基因选择,得到特征基因数据;将所述训练数据对应的特征基因数据注入分类器,对所述分类器进行训练,得到训练后分类器;将所述测试数据对应的特征基因数据注入所述训练后分类器,得到所述测试数据对应的特征基因数据的分类结果。 |
地址 |
518055 广东省深圳市南山区西丽大学城学苑大道1068号 |