发明名称 一种基于牵连犯罪原则和网络拓扑结构特征的药物-靶标相互作用识别方法
摘要 本发明公开了一种基于牵连犯罪原则和网络拓扑结构特征的药物-靶标相互作用识别方法。首先根据人类蛋白质与蛋白质相互作用数据和药物-靶标相互作用数据,构建包含蛋白质-蛋白质相互作用子网络、药物-靶标相互作用子网络和药物-药物关系子网络的药物-靶标相互作用组网络;利用蛋白质一级结构描述符、药物分子指纹特征以及相互作用可靠性等信息,对网络中的节点和边加权;基于牵连犯罪原则和图论,提出新的网络拓扑结构特征表征药物-靶标相互作用对;最后采用随机森林算法构建模型,在蛋白组尺度预测潜在药物-靶标相互作用。本方法不需要蛋白质和药物分子的三维结构等信息,更加简单、快速和准确,有望应用于新药研发和病理学研究等领域。
申请公布号 CN105117618A 申请公布日期 2015.12.02
申请号 CN201510494047.2 申请日期 2015.08.12
申请人 广东顺德中山大学卡内基梅隆大学国际联合研究院;广东药学院;中山大学 发明人 李占潮;邹小勇;戴宗
分类号 G06F19/16(2011.01)I 主分类号 G06F19/16(2011.01)I
代理机构 广州粤高专利商标代理有限公司 44102 代理人 林丽明
主权项 一种基于牵连犯罪原则和网络拓扑结构特征的药物‑靶标相互作用识别方法,其特征在于,包括以下步骤:S1.构建药物‑靶标相互作用组网络S11.从现有数据库收集人类蛋白质与蛋白质相互作用数据和药物‑靶标相互作用数据;S12.基于相互作用数据,构建包含蛋白质‑蛋白质相互作用子网络、药物‑靶标相互作用子网络和药物‑药物关系子网络的综合药物‑靶标相互作用组网络;S2.表征药物‑靶标相互作用对S21.基于蛋白质一级序列信息和药物小分子结构信息,分别计算其一级结构描述符和药物分子指纹描述符,结合相互作用信息,对网络节点和边加权;S22.基于加权的节点和边信息,采用牵连犯罪原则和图论分别计算网络中蛋白质和药物小分子的网络拓扑结构特征,网络拓扑结构特征通过下式计算:<img file="887890dest_path_image002.GIF" wi="351" he="47" /><img file="867347dest_path_image004.GIF" wi="342" he="47" />式中,D<i>d</i>(<i>i</i>)和D<i>j</i>(<i>i</i>)分别表示药物分子<i>d</i>和邻居药物分子<i>j</i>的第<i>i</i>个节点权重;<i>Ed</i>,<i>j</i>是药物分子<i>d</i>和<i>j</i>的边权重;<i>Pp</i>(<i>i</i>)和P<i>j</i>(<i>i</i>)分别是蛋白质<i>p</i>和其邻居蛋白质<i>j</i>的第<i>i</i>个节点权重;<i>Ep</i>,<i>j</i>是蛋白质<i>p</i>和邻居<i>j</i>的边权重;<i>N</i>是药物分子<i>d</i>或者蛋白质<i>p</i>的邻居总数;S23.基于蛋白质和药物小分子的网络拓扑结构特征,提出药物<i>d</i>‑靶标<i>p</i>的相互作用对网络拓扑结构特征,其表示如下:<img file="647085dest_path_image006.GIF" wi="197" he="24" />式中,+表示正交求和;S3.采用随机森林算法构建预测模型,预测潜在药物‑靶标相互作用。
地址 528399 广东省佛山市顺德区南国东路顺德一中行政楼1-401房