发明名称 一种集成药物靶标预测系统的构建和预测方法
摘要 本发明公开了一种集成药物靶标预测系统的构建和预测方法。分析蛋白质晶体结构数据库,选取已与类药性配体小分子结合的蛋白质,或具有与小分子配体结合潜能的蛋白质作为靶点,建立靶标的晶体结构数据库,针对这些靶标,收集其与疾病的相关信息、生物学类别以及活性小分子配体信息,集成由活性位点数据库、药效团数据库、小分子化合物数据库以及靶标基本信息数据库组成的综合型靶标筛选数据库。在综合型靶标筛选数据库基础上,通过脚本程序或PipelinePilot流程实现集成药物靶标预测系统的构建,给出该方法的靶标预测准确度的概率。本发明发挥上述三项技术优势,给出靶标预测的概率,为进行进一步实验验证提供了有效的依据。
申请公布号 CN102663214B 申请公布日期 2013.11.06
申请号 CN201210140708.8 申请日期 2012.05.09
申请人 四川大学 发明人 杨胜勇;李国菠;李琳丽;魏于全
分类号 G06F17/50(2006.01)I 主分类号 G06F17/50(2006.01)I
代理机构 成都睿道专利代理事务所(普通合伙) 51217 代理人 潘育敏
主权项 1.一种集成药物靶标预测系统的构建和预测方法,其特征在于:分析蛋白质晶体结构数据库,选取已与类药性配体小分子结合的蛋白质,或具有与小分子配体结合潜能的蛋白质作为靶点,建立靶标的晶体结构数据库,对于同一个靶标,如有多个晶体结构则选取分辨率较高的1个或多个晶体结构拷贝,针对这些靶标,收集其与疾病的相关信息、生物学类别以及活性小分子配体信息,组建由活性位点数据库、药效团数据库、小分子化合物数据库以及靶标基本信息数据库组成的综合型靶标筛选数据库;在综合型靶标筛选数据库基础上,通过脚本程序或Pipeline Pilot流程实现集成分子对接技术、药效团模型和小分子结构相似性三项靶标预测系统的构建,采用基于概率统计的集成方法联合这三项技术实现药物靶标综合预测,并给出该方法的靶标预测准确度的概率;步骤是: (1)收集药物靶标的晶体结构: 分析蛋白质晶体结构数据库PDB,选取已与类药性配体小分子结合的蛋白质,或具有与小分子配体结合潜能的蛋白质作为靶点,对于同一个靶标,如有多个晶体结构则选取分辨率较高的1个或多个晶体结构拷贝; (2)组建综合型靶标筛选数据库: 对上述收集的药物靶标,建立靶标活性位点数据库,为基于分子对接的靶标预测提供基础;针对收集的靶标晶体结构,采用基于受体的药效团建模方法建立药效团模型数据库,为基于药效团模型的靶标预测方法提供基础;收集药物靶标的活性小分子配体,建立小分子配体数据库,为基于小分子结构相似性的靶标预测方法提供基础;收集药物靶标结构名称、生物功能类别、相关疾病以及药物研发信息,建立药物靶标基本信息数据库,为靶标预测提供相关信息; (3)建立基于分子对接、药效团模型和小分子结构相似性的靶标预测系统: 在Linux系统下构建脚本程序,自动调用GOLD对接软件实现一个给定药物分子或活性化合物与靶标数据库的靶标活性位点对接,同时输出打分函数Chemscore和Goldscore的打分值,实现基于分子对接的靶标预测;通过在Linux系统下构建脚本程序,利用Catalyst软件实现一个药物分子或活性化合物与药效团模型数据库所有药效团自动匹配,并输出相应的匹配值Fitvalue,实现基于药效团模型的靶标预测;通过使用Pipeline Pilot8.5软件构建流程,基于小分子结构指纹图谱ECFP_4,计算一个给定药物分子或活性化合物与靶标小分子配体数据库中的化合物的Tanimoto系数,实现基于小分子相似性的靶标预测; (4)活性分子概率分布曲线的建立: 首先,通过挑选若干个不同类型的靶标,针对每个靶标分别构建活性化合物集合和非活性化 合物集合Decoys,组成训练集,利用分子对接、药效团、小分子结构相似性三种方法针对各个靶标及相应训练集进行筛选;集中所有训练集的化合物以及各自评分,包括分子对接打分函数Chemscore的打分值和打分函数Goldscore的打分值、药效团匹配值Fitvalue、小分子化合物与靶标已知活性配体相似性比较系数Tanimoto,分别统计其不同评分分数段活性分子的概率,利用最小二乘法拟合评分与评分分数段的概率之间的关系,得到各自评分的活性分子概率分布曲线; (5)集成的药物靶标预测: 在进行药物或活性化合物的靶标预测时,分别采用基于分子对接的方法、基于药效团模型的方法和基于小分子结构相似性的方法进行靶标预测,将各评分通过相应的活性分子概率曲线转化为该评分预测正确的概率,然后采用置信理论Belief Theory计算三种方法的综合预测正确的总概率,根据总概率对靶标数据库所有靶标进行排序,排名靠前为预测化合物潜在作用靶标; 集成的药物靶标预测的具体步骤是: 1)通过已建立的基于分子对接、药效团模型和小分子结构相似性的靶标预测系统,分别实现待测药物或活性化合物与靶标活性位点数据进行对接并输出打分函数Chemscore和打分函数Goldscore的打分值,与靶标药效团数据库进行匹配并输出匹配值Fitvalue,与靶标活性配体数据库进行基于二维指纹图谱的相似性比对并输出相似度量值Tanimoto系数; 2)将与靶标活性位点数据进行对接的打分函数Chemscore和打分函数Goldscore的打分值、与靶标药效团数据的匹配值Fitvalue值、与靶标小分子配体数据基于二维指纹图谱的相似性比对相似度量值Tanimoto系数,分别通过各自相应的活性分子概率分布曲线转化为其预测正确的概率; 3)每个靶标不同评分预测正确的概率,通过置信理论公式计算三种方法综合预测正确的总概率,置信理论公式(1)为: <img file="FDA0000367751270000021.GIF" wi="1418" he="124" />式中,P表示总概率,P<sub>i</sub>表示某靶标不同评分预测正确的概率; 4)按照总概率大小进行靶标排序,总概率值越大代表相应药物靶标成为待测药物的靶标可能性越大,并结合靶标基本信息数据库,最终给出待测药物的潜在作用靶标列表。 
地址 610064 四川省成都市一环路南一段24号