发明名称 一种非核糖体蛋白质-RNA复合物近天然结构的筛选方法
摘要 一种非核糖体蛋白质-RNA复合物近天然结构的筛选方法,属于蛋白质-RNA分子对接复合物结构预测领域。首先,通过构象搜索获得蛋白质-RNA各种可能的结合模式;然后,对其合理性进行评价,其间综合考虑了蛋白质-RNA分子间的静电和范德华相互作用能,以及复合物界面上氨基酸-核苷酸成对偏好势。各项的权重是通过采用线性回归的方法,来对对接结构的配体均方根偏差和其能量项的加权组合值进行拟合得到的;最后,根据分值从小到大进行排序,从而判断近天然结构。该方法在非核糖体蛋白质-RNA分子对接近天然结构的筛选中有很好的效果,成功率较高,可用于该类蛋白质-RNA复合物结构预测领域,为分子改造和设计提供重要的依据。
申请公布号 CN103500293A 申请公布日期 2014.01.08
申请号 CN201310400300.4 申请日期 2013.09.05
申请人 北京工业大学 发明人 李春华;张弘古村;刘斌;谢小露;张蕾;谭建军;张小轶;王存新
分类号 G06F19/22(2011.01)I 主分类号 G06F19/22(2011.01)I
代理机构 北京思海天达知识产权代理有限公司 11203 代理人 张慧
主权项 1.一种非核糖体蛋白质-RNA复合物近天然结构的筛选方法,其特征在于,包括以下步骤: 步骤(1): 采用FTDock软件对蛋白质-RNA结合模式进行构象搜索;只是利用了FTDock中的快速傅里叶变换搜索方法进行构象搜索; 步骤(2): 对步骤(1)获得的结合模式进行分值计算,该分值是一个加权组合打分函数的结果,打分函数为: 分值=0.01017×E<sub>ele</sub><sup>sa</sup>+0.01198×E<sub>ele</sub><sup>sr</sup>+0.01148×E<sub>ele</sub><sup>la</sup>+0.01071×E<sub>ele</sub><sup>lr</sup>+0.02421×V<sub>attr</sub>+0.00215×V<sub>rep</sub>+0.12786×E<sub>rp</sub>     (1) 其中,E<sub>ele</sub><sup>sa</sup>,E<sub>ele</sub><sup>sr</sup>,E<sub>ele</sub><sup>la</sup>,E<sub>ele</sub><sup>lr</sup>,V<sub>attr</sub>,V<sub>rep</sub>,E<sub>rp</sub>依次代表静电短程吸引、静电短程排斥、静电长程吸引、静电长程排斥、范德华吸引、范德华排斥和氨基酸-核苷酸成对偏好势;下面列出各项具体的计算公式。 静电相互作用能为: <img file="FDA0000377780760000011.GIF" wi="1114" he="167" />其中,q<sub>i</sub>,q<sub>j</sub>分别代表原子i和j的电荷,根据原子类型及其所在的氨基酸和核苷酸类型从AMBER力场参数中获取;r<sub>ij</sub>代表原子i与原子j之间的距离,通过原子的空间坐标得到;当r<sub>ij</sub>小于<img file="FDA0000377780760000012.GIF" wi="151" he="76" />时,则取<img file="FDA0000377780760000013.GIF" wi="262" he="87" />若E<sub>ele</sub>&lt;0则为吸引,E<sub>ele</sub>&gt;0则为排斥;若<img file="FDA0000377780760000014.GIF" wi="314" he="87" />则为短程作用,<img file="FDA0000377780760000015.GIF" wi="253" he="87" />则为长程作用;范德华吸引和排斥相互作用能分别为: <img file="FDA0000377780760000016.GIF" wi="1718" he="201" /><img file="FDA0000377780760000021.GIF" wi="1717" he="175" />其中,r<sub>ij</sub>代表原子i与原子j之间的距离,r<sub>m,ij</sub>代表原子i与原子j的范德华半径之和,ε<sub>ij</sub>是原子i,j势阱深度乘积的平方根,范德华半径及原子势阱深度可根据原子类型及其所在的氨基酸和核苷酸类型从AMBER力场中获取; 60×8氨基酸-核苷酸成对偏好势为: <img file="FDA0000377780760000022.GIF" wi="1393" he="124" />其中,R为普适气体常数,T为绝对温度,这里取RT=0.59kcal/mol;P<sub>ab</sub>为考虑了复合物类型及蛋白质和RNA二级结构信息的氨基酸a与核苷酸b之间的成对偏好性,具体P<sub>ab</sub>的数值见表1;这里氨基酸为60种,核苷酸为8种,在分值计算中只需根据氨基酸类型和核苷酸类型,直接在矩阵中找到对应的P<sub>ab</sub>的值; 表1.60×8氨基酸-核苷酸成对偏好性 <img file="2013104003004100001DEST_PATH_IMAGE001.GIF" wi="612" he="400" /><img file="2013104003004100001DEST_PATH_IMAGE002.GIF" wi="616" he="835" />表1.(继续) <img file="2013104003004100001DEST_PATH_IMAGE003.GIF" wi="612" he="786" />表1.(继续) <img file="2013104003004100001DEST_PATH_IMAGE004.GIF" wi="612" he="786" />表1.(继续) <img file="2013104003004100001DEST_PATH_IMAGE005.GIF" wi="616" he="529" />c:蛋白质二级结构被分为三类X,Y,Z; d:RNA二级结构被分为两类M,N; 根据以上公式(1)-(5),对蛋白质-RNA构象搜索中获得的结合模式进行分值计算,分别获得其分值; 步骤(3): 对结合模式所得分值由低到高进行排序,近天然结构包含在分值最低的前2000个结合模式中。 
地址 100124 北京市朝阳区平乐园100号