发明名称 一种基于先验信息和并行二进制微粒群算法的肿瘤关键基因识别方法
摘要 本发明公开了一种基于先验信息和并行二进制微粒群算法的肿瘤关键基因识别方法,包括肿瘤基因表达谱数据的预处理,在训练集上,通过自定义的准则函数,利用改进的Elbow方法确定最优基因聚类数目K;运用微粒群算法PSO优选K个最优聚类中心,并在训练集上用K‑均值方法将肿瘤基因聚成K类;在训练集上,分别获取基因类别灵敏度GCS信息和基因调控GR信息;通过所得的K个基因簇为搜索空间,结合上述获得的两类先验信息,运用并行二进制微粒群算法BPSO识别出关键的肿瘤基因。与现有的肿瘤关键基因识别方法相比,本发明通过考虑两类先验约束降低了丢失与肿瘤类别相关的关键信息基因的概率,从而有助于提高后续的肿瘤识别。
申请公布号 CN106548041A 申请公布日期 2017.03.29
申请号 CN201611126799.4 申请日期 2016.12.08
申请人 江苏大学 发明人 韩飞;杨春;凌青华;崔宝祥;宋余庆;朱玉全;周从华
分类号 G06F19/18(2011.01)I;G06F19/24(2011.01)I 主分类号 G06F19/18(2011.01)I
代理机构 代理人
主权项 一种基于先验信息和并行二进制微粒群算法的肿瘤关键基因识别方法,其特征在于,包括下列步骤:步骤1肿瘤基因表达谱数据的预处理,包括肿瘤基因表达谱数据集的归一化和初步降维,同时将肿瘤基因表达谱数据集划分为训练集和测试集;步骤2在训练集上,通过自定义的准则函数,利用改进的Elbow方法确定最优基因聚类数目K;步骤3运用微粒群算法PSO优选K个最优聚类中心,并在训练集上用K‑均值方法将肿瘤基因聚成K类;步骤4在训练集上,分别获取基因类别灵敏度GCS信息和基因调控GR信息;步骤5以步骤3所得的K个基因簇为搜索空间,结合步骤4获得的两类先验信息,运用并行二进制微粒群算法BPSO识别出关键的肿瘤基因。
地址 212013 江苏省镇江市京口区学府路301号