发明名称 一种靶向作用于蛋白激酶非活性构象的化合物筛选方法
摘要 本发明属于蛋白质结构预测和药物分子虚拟筛选技术领域,具体为一种靶向作用于蛋白激酶非活性构象的化合物筛选方法。本发明包括蛋白激酶活性链段构象预测方法,从激酶的DFG-in活性构象来产生相应的DFG-out非活性构象;还包含II型抑制剂对接后结合构象的挑选方法,用于构象预测和虚拟筛选中小分子的挑选。本发明已经在7种已知非活性构象的蛋白激酶上进行了计算验证,成功率接近96%。本发明方法已用于预测结核杆菌的PknB蛋白激酶的非活性构象,并虚拟筛选了PknB可能的II型抑制剂,经抑菌实验验证,已发现2种小分子已证明具有抑菌作用。
申请公布号 CN102156823B 申请公布日期 2015.04.22
申请号 CN201110040325.9 申请日期 2011.02.18
申请人 复旦大学 发明人 黄强;徐旻;张雪莲;王洪海;万波
分类号 G06F19/10(2011.01)I 主分类号 G06F19/10(2011.01)I
代理机构 上海正旦专利代理有限公司 31200 代理人 陆飞;盛志范
主权项  一种预测蛋白激酶非活性构象的计算模拟方法,其特征在于具体步骤为:<b>第一步,构建初始结构模型</b>从PDB数据库中下载既有DFG‑in又有DFG‑out构象的蛋白激酶PDB文件;对所得的PDB文件进行预处理,去除其中的水分子;如果预处理后所得物是多聚体则取其中的一个单体,如果预处理后所得物的晶体结构中含有磷酸基团,用MODELLER同源模建程序将其突变为原始残基,对于缺少残基的蛋白激酶也同样采用MODELLER程序以自身为模板进行补齐;然后将所得的PDB文件用Rosetta软件的relax功能进行优化得到初步的起始结构模型;<b>第二步,蛋白激酶的活性链段重塑</b>采用Rosetta 3软件的“loop_relax”功能来进行蛋白激酶的活性链段重塑,按Rosetta 3的loopmodeling功能,设定目标蛋白质的若干片断为对象,对其进行重新的结构预测,运用模拟退火等算法寻找目标片断的最低能量构象;其中,首先从蛋白激酶的FASTA序列得到其fragments文件,然后设定需要重塑的链段在蛋白质中的位置,其中设定的链段对象具体是以DFG基序之前第二个残基为起始,蛋白激酶活性链段的C末端为结尾的;以这段序列中位于中点附近最亲水的残基为剪切断点;最后设定文件所在的路径以及默认的参数,然后递交计算机进行计算;在活性链段重塑之后,对结果的侧链进行全原子优化,获得最终的全原子最低能量构象;<b>第三步,将预测构象按几何分类方法,进行DFG‑in和DFG‑out分类</b>对于重塑后获得的模型,按DFG‑in、DFG‑out和过渡构象进行分类;如果模型的Asp和Phe残基和相应的DFG‑in结构中的这2个残基都位于同侧,那么就把它归为DFG‑in构象的;如果情况正好相反,那么就把它归为DFG‑out构象的;其它所有的模型都归为过渡构象;其中,4个残基的位置通过构建向量的方法来进行判别,具体步骤如下:取出模型和初始DFG‑in结构中各4个点的坐标,即Asp的C<sub>γ</sub>原子、Asp的C<sub>α</sub>原子、Phe382的C<sub>α</sub>原子和Phe382的C<sub>γ</sub>原子,分别标为R1、R2、R3、R4和R1'、R2'、R3'、R4',得到8个向量:<b>r<sub>21</sub></b>=R1‑R2;<b>r<sub>23</sub></b>=R3‑R2;<b>r<sub>32</sub></b>=R2‑R3;<b>r<sub>34</sub></b>=R4‑R3;<b>r<sub>21</sub>'</b>=R1'‑R2';<b>r<sub>23</sub>'</b>=R3'‑R2';<b>r<sub>32</sub>'</b>=R2'‑R3';<b>r<sub>34</sub>'</b>=R4'‑R3';将上述8个向量叉乘后得到4个向量:<b>p<sub>1</sub>=r<sub>21</sub>×r<sub>23</sub>    p<sub>2</sub>=r<sub>34</sub>×r<sub>32    </sub>p<sub>1</sub>'=r<sub>21</sub>'×r<sub>23</sub>'     p<sub>2</sub>'=r<sub>34</sub>'×r<sub>32</sub>'</b>最终,将所有模型和已有的DFG‑out构象叠加,并取出上述8个点,计算各个向量,并规定:若<b>p<sub>1</sub>•p<sub>1</sub>'</b><i></i>&lt; 0且<b>p<sub>2</sub>•p<sub>2</sub>' </b>&lt; 0,那么就认为模型是一个DFG‑out构象;若<b>p<sub>1</sub>•p<sub>1</sub>' </b>&gt; 0且<b>p<sub>2</sub>•p<sub>2</sub>' </b>&gt; 0,那么就认为模型是一个DFG‑in构象;其它的就认为是过渡构象;<b>第四步,DFG‑out模型的选择</b>使用Putative Active Sites with Spheres蛋白质活性位点预测程序来探测活性位点附近可能的结合位点,以进一步分析已知DFG‑out结构中活性位点的疏水腔,蛋白质活性位点预测程序的结果显示在DFG‑out结构的活性位点存在有3个结合口袋,这三个结合口袋中心被分别记为B<sub>1</sub>、B<sub>2</sub>和B<sub>3</sub>,这三个口袋被Seeliger<i> et al. </i>分别定义为疏水区I、腺嘌呤口袋以及异构位点;使用LIGSITE程序来计算口袋中相距1 Å的格点数,将格点数转化为1 g∙ml<sup>‑1</sup>密度的水分子个数,即将活性口袋中的格点放入一个足够大的水盒子中,并且认为任何离格点最近距离大于1.6 Å的水分子是未被占据的;按活性腔中能包含大于20个水分子为标准来选择DFG‑out模型,构成可用于分子对接的非活性构象系综。
地址 200433 上海市杨浦区邯郸路220号