发明名称 一种基于多层复杂网络筛选肿瘤蛋白质标志物的方法
摘要 本发明提供的一种基于多层复杂网络筛选肿瘤蛋白质标志物的方法,将随机森林模型和复杂网络中的节点介数结合在一起,提供一种新的视角分析发现肿瘤致病因子和诊断标记物。通过生物信息学,数学统计分析,建立多层蛋白质网络数据的相关性,从而提出一种更加简便,准确度更高的筛选方法,从而为癌症诊断和药物的发现提供更有价值的参考。
申请公布号 CN106407742A 申请公布日期 2017.02.15
申请号 CN201610738177.0 申请日期 2016.08.26
申请人 赵毅 发明人 赵毅;张阳
分类号 G06F19/18(2011.01)I;G06F19/24(2011.01)I 主分类号 G06F19/18(2011.01)I
代理机构 北京高沃律师事务所 11569 代理人 李娜
主权项 一种基于多层复杂网络筛选肿瘤蛋白质标志物的方法,其特征在于,包括以下步骤:1)提供肿瘤病人的蛋白质数据,所述蛋白质数据包括肿瘤病人正常组织的蛋白质数据和肿瘤组织的蛋白质数据;2)将所述步骤1)得到的正常组织的蛋白质数据和肿瘤组织的蛋白质数据分别进行过滤;3)采用随机森林模型对所述步骤2)中得到同一病人的正常组织的蛋白质数据和肿瘤组织的蛋白质的表达量选择最佳子集,计算最佳子集的蛋白质的最大信息系数MIC;4)基于所述步骤3)的最佳子集蛋白质的最大信息系数分别构建正常组织和肿瘤组织的蛋白质网络;5)计算在正常组织和肿瘤组织的蛋白质网络中同一节点的节点介数,比较并统计正常组织和肿瘤组织的网络中节点介数发生较大变化的点,从而筛选出肿瘤蛋白质标志物的种类。
地址 518000 广东省深圳市南山区深圳大学城哈工大校区G栋420室