发明名称 一种基于多层复杂网络对肿瘤miRNA标志物的筛选方法
摘要 本发明提供的一种基于多层复杂网络对肿瘤miRNA标志物的筛选方法,将随机森林模型和复杂网络中的节点介数结合在一起,用最小网格聚类方法验证,提供一种新的视角分析发现肿瘤致病因子和诊断标记物。通过生物信息学,数学统计分析,建立不同miRNA网络数据的相关性,用平均边覆盖和度分布比较miRNA表达量网络、miRNA结构网络和miRNA序列网络,从而分析整合了与肿瘤相关的不同miRNA的数据网络,在各种不同类型miRNA数据层之间建立起聚类特征的内部连结,以形成一个复杂的网络。这种不同种类生物分子之间的高度整合提供了一种更加简便,准确度更高的筛选方法,从而为癌症诊断和药物的发现提供更有价值的参考。
申请公布号 CN106202984A 申请公布日期 2016.12.07
申请号 CN201610736741.5 申请日期 2016.08.26
申请人 赵毅 发明人 赵毅;张阳;丛威荟
分类号 G06F19/00(2011.01)I 主分类号 G06F19/00(2011.01)I
代理机构 北京高沃律师事务所 11569 代理人 李娜
主权项 一种基于多层复杂网络对肿瘤miRNA标志物的筛选方法,其特征在于,包括以下步骤:1)提供肿瘤病人的miRNA数据,所述miRNA数据包括肿瘤病人正常组织的miRNA数据和肿瘤组织的miRNA数据;2)将所述步骤1)得到的正常组织的miRNA数据和肿瘤组织的miRNA数据分别进行过滤;3)将所述步骤2)过滤后的肿瘤组织的miRNA数据分别做归一化处理,得到标准化的肿瘤组织的miRNA数据;4)将所述步骤3)得到的标准化的miRNA数据与下载的miRNA成熟序列进行序列比对,分别得到miRNA表达水平之间的欧式距离矩阵、二级结构间的差异矩阵和miRNA的序列比对值矩阵;5)将所述步骤4)得到的三个矩阵分别作为网络中节点间的距离,分别构建miRNA表达量网络、miRNA结构网络和miRNA序列网络;6)比较所述步骤5)中的三个网络的平均边覆盖和度分布,得到具有相似二级结构的miRNA,所述相似二级结构的miRNA的表达量也相似;7)采用随机森林模型对所述步骤2)中得到相同病人的正常组织的miRNA数据和肿瘤组织的miRNA的表达量选择最佳子集,计算最佳子集的miRNA的MIC值;8)基于所述步骤7)的最佳子集miRNA的MIC值分别构建正常组织和肿瘤组织的miRNA网络;9)计算在正常组织和肿瘤组织的miRNA网络中同一节点的节点介数,比较并统计正常组织和肿瘤组织的网络中节点介数发生较大变化的点,从而筛选出肿瘤miRNA标志物的种类。10)采用最小网格聚类方法对所述步骤4)得到的miRNA序列比对值矩阵进行聚类,将序列相似的miRNA聚为一类,根据已知的miRNA的功能推知具有相同序列的miRNA的功能,从而验证筛选出肿瘤miRNA标志物的种类是否准确。
地址 518000 广东省深圳市南山区深圳大学城哈工大校区G栋420室