发明名称 一种基于生物网络的癌症驱动基因的筛选方法
摘要 一种基于生物网络的癌症驱动基因的筛选方法,包括如下步骤:(1)癌症差异表达基因筛选;(2)癌症生物分子网络构建;(3)基于癌症生物分子网络的基因癌症驱动力计算;(4)根据驱动力计算结果排序确定癌症驱动基因;本发明方法不仅和成熟可靠的现代高通量技术紧密结合,而且符合系统生物学和网络药理学理论,与生物网络的结合使癌症驱动基因的筛选更加的贴合生物体内的生物学过程,为进一步的基因靶点药物研发打下了重要基础。
申请公布号 CN104732116A 申请公布日期 2015.06.24
申请号 CN201510111810.9 申请日期 2015.03.13
申请人 西安交通大学 发明人 张虎勤;何冰;刘芳娥;杜建强;赵静;林松;刘治镇
分类号 G06F19/18(2011.01)I;C12Q1/68(2006.01)I 主分类号 G06F19/18(2011.01)I
代理机构 西安智大知识产权代理事务所 61215 代理人 弋才富
主权项 一种基于生物网络的癌症驱动基因的筛选方法,其特征在于,包括如下步骤:(1)癌症差异表达基因筛选:选择一套包含癌症组织和对应正常样本的基因表达谱数据集作为分析基础,使用Fold change方法比较基因在每对癌症组织和正常组织中的表达量差异,将在癌症对正常样本比较中出现两倍及以上表达量差异的基因作为候选差异表达基因集合,然后对此集合进行筛选,将至少有三例以上癌症样本支持的基因作为癌症差异表达基因;(2)癌症生物分子网络构建:整合BIOGRID数据库和HPRD数据库中的人类蛋白质相互作用数据,对蛋白质相互作用的数据进行筛选,筛选标准是:将一篇以上实验文献支持的蛋白质‑蛋白质相互作用关系整理出来,删除不符合前述要求的蛋白质‑蛋白质相互作用关系,使用筛选后的蛋白质‑蛋白质相互作用关系将癌症差异表达基因编码的蛋白连接起来,建立人类癌症生物分子网络;(3)基于癌症生物分子网络的基因癌症驱动力计算:对人类癌症生物分子网络进行拓扑结构分析,计算每个分子与网络中其他分子相互作用的次数,也就是拓扑学理论中的Degree,作为单个分子的癌变基础效力值,此效力值越高,与此分子作用的癌症分子越多,此分子在癌症中的作用越重要,然后使用如下公式计算网络中编码每个蛋白质分子的基因的癌变驱动力:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>DP</mi><mi>i</mi></msub><mo>=</mo><mfrac><msub><mi>NC</mi><mi>i</mi></msub><mi>NP</mi></mfrac><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><mfrac><msub><mi>NC</mi><mi>j</mi></msub><mi>NP</mi></mfrac><msub><mi>D</mi><mi>j</mi></msub></mrow>]]></math><img file="FDA0000681912510000011.GIF" wi="529" he="215" /></maths>公式(I)i为癌症生物分子网络中的一个蛋白质;j为癌症生物分子网络中与蛋白质i相互作用的另一个蛋白质;n为癌症生物分子网络中与蛋白质i相互作用的蛋白质总数;DP<sub>i</sub>为编码癌症生物分子网络中的一个蛋白质i的基因的癌变驱动力值;VC<sub>i</sub>为发生编码蛋白质i的基因差异表达的癌症样本数目;NC<sub>j</sub>为发生编码蛋白质j的基因差异表达的癌症样本数目;D<sub>j</sub>为蛋白质j的癌变基础效力值,也就是与蛋白质j相互作用的癌症分子总数;NP为整个数据集合所有癌症样本的数目;(4)根据驱动力计算结果排序确定癌症驱动基因:对步骤3计算获得的所有基因的癌症驱动力按照数值大小进行排序;数值越大,排序越高,其作为癌症驱动基因的可能性越高,将排序前十位的基因作为此癌症的驱动基因。
地址 710049 陕西省西安市咸宁路28号