发明名称 | 一种面向SNP数据的特征选择方法 | ||
摘要 | 本发明公开了一种面向SNP数据的特征选择方法。其具体步骤如下:首先进行数据预处理;然后用重新设计的Relief算法剔除无关SNP特征;然后用改进的SVM-RFE算法对SNP特征进行关键性程度排序;最后使用交叉验证来筛选关键SNPs。该发明结合了Filter式特征选择和Wrapper式特征选择的优势,并在机器学过程中使用二次划分方法,解决了SNP数据特征选择中的高维小样本及SNP致病组合模式的问题,提高了分析效率和准确率。 | ||
申请公布号 | CN102629305A | 申请公布日期 | 2012.08.08 |
申请号 | CN201210055566.5 | 申请日期 | 2012.03.06 |
申请人 | 上海大学 | 发明人 | 吴悦;吴红霞;雷州;刘宗田;张文宾 |
分类号 | G06F19/22(2011.01)I | 主分类号 | G06F19/22(2011.01)I |
代理机构 | 上海上大专利事务所(普通合伙) 31205 | 代理人 | 何文欣 |
主权项 | 一种面向SNP数据的特征选择方法,其特征在于具体操作步骤如下:(1)、进行数据预处理;(2)、用重新设计的Relief算法剔除无关SNP特征;(3)、用改进的SVM‑RFE算法对SNP特征进行关键性程度排序;(4)、使用十字交叉验证来筛选关键SNPs。 | ||
地址 | 200444 上海市宝山区上大路99号 |