发明名称 一种面向SNP数据的特征选择方法
摘要 本发明公开了一种面向SNP数据的特征选择方法。其具体步骤如下:首先进行数据预处理;然后用重新设计的Relief算法剔除无关SNP特征;然后用改进的SVM-RFE算法对SNP特征进行关键性程度排序;最后使用交叉验证来筛选关键SNPs。该发明结合了Filter式特征选择和Wrapper式特征选择的优势,并在机器学过程中使用二次划分方法,解决了SNP数据特征选择中的高维小样本及SNP致病组合模式的问题,提高了分析效率和准确率。
申请公布号 CN102629305A 申请公布日期 2012.08.08
申请号 CN201210055566.5 申请日期 2012.03.06
申请人 上海大学 发明人 吴悦;吴红霞;雷州;刘宗田;张文宾
分类号 G06F19/22(2011.01)I 主分类号 G06F19/22(2011.01)I
代理机构 上海上大专利事务所(普通合伙) 31205 代理人 何文欣
主权项 一种面向SNP数据的特征选择方法,其特征在于具体操作步骤如下:(1)、进行数据预处理;(2)、用重新设计的Relief算法剔除无关SNP特征;(3)、用改进的SVM‑RFE算法对SNP特征进行关键性程度排序;(4)、使用十字交叉验证来筛选关键SNPs。
地址 200444 上海市宝山区上大路99号