发明名称 一种基于两阶段差分进化算法的蛋白质结构预测方法
摘要 一种基于两阶段差分进化算法的蛋白质结构预测方法,在差分进化算法(DE)的框架下,首先,对输入的查询序列进行随机的折叠、扰动,生成具有多样化折叠类型的初始构象种群;然后,根据迭代次数将构象搜索分为两个阶段,第一个阶段从种群中随机选取一个构象作为目标个体,第二个阶段根据能量将种群分为两个部分,从能量低的前50%的种群中随机选取一个个体作为目标个体;之后,随机选取与目标个体不一样的三个构象个体经过变异、交叉和片段组装策略生成测试个体;在种群更新时,根据构象的能量判断是否接受测试个体;在两阶段策略的指导下,通过不断更新种群获得预测精度较高、复杂度较低的一系列亚稳态构象。本发明预测精度较高、复杂度较低。
申请公布号 CN105760710A 申请公布日期 2016.07.13
申请号 CN201610139379.3 申请日期 2016.03.11
申请人 浙江工业大学 发明人 张贵军;俞旭锋;周晓根;郝小虎;王柳静;李章维
分类号 G06F19/16(2011.01)I 主分类号 G06F19/16(2011.01)I
代理机构 杭州斯可睿专利事务所有限公司 33241 代理人 王利强
主权项 一种基于两阶段差分进化算法的蛋白质结构预测方法,其特征在于:所述预测方法包括以下步骤:1)给定查询序列信息;2)初始化:设置群体规模NP,变异因子F,交叉概率CR,迭代次数iteration,片段长度为L,能量函数选用Rosetta Score3,首先通过对查询序列随机的折叠和变换,生成一个规模为NP的初始种群,初始群体为P={x<sup>i</sup>|i∈I},计算初始种群个体的能量值f(x<sup>i</sup>),i∈I,其中i为种群个体编号,I为种群个体编号集合,I={1,2,...,NP};3)开始迭代,令g=1,g为迭代计数器,依次对种群中每个个体进行以下操作:3.1)如果g&lt;iteration/2,则执行如下操作:随机选取种群中的一个构象个体P<sub>i</sub>,i∈{1,2,3,…,NP},令P<sub>target</sub>=P<sub>i</sub>,P<sub>target</sub>表示目标构象个体,跳转至3.3),执行以下操作得到变异构象P<sub>mutant</sub>;3.2)如果iteration/2&lt;g&lt;iteration,则执行如下操作:根据能量对整个种群中的构象进行降序排列,然后从能量低的前50%的NP个构象个体中随机选出一个构象记为P<sub>pbest</sub>,令P<sub>target</sub>=P<sub>pbest</sub>,P<sub>target</sub>表示目标构象个体,执行以下操作得到变异构象P<sub>mutant</sub>;3.3)随机生成正整数rand1,rand2,rand3∈{1,2,3,......NP},且rand1≠rand2≠rand3≠i;再生成4个随机整数randrange1,randrange2,randrange3,randrange4;其中randrange1≠randrange2,randrange3≠randrange4∈{1,2,…,Length},Length为序列长度;3.4)令a=min(randrange1,randrange2),b=max(randrange1,randrange2),k∈[a,b];令c=min(randrange3,randrange4),d=max(randrange3,randrange4),p∈[c,d];其中min表示取两个数的最小值,max表示取两个数的最大值;3.5)用P<sub>rand2</sub>上位置a到位置b的片段的氨基酸所对应的二面角phi、psi、omega替换P<sub>rand1</sub>的相同位置所对应的二面角phi、psi、omega;再使用P<sub>rand3</sub>上位置c到位置d的片段的氨基酸所对应的二面角phi、psi、omega替换P<sub>rand1</sub>上相同位置所对应的二面角phi、psi、omega,再将所得P<sub>rand1</sub>进行片段组装得到测试个体P<sub>trail</sub>;3.6)针对测试个体P<sub>trail</sub>做交叉操作,过程如下:3.6.1)生成随机数rand4,rand5,其中rand4∈(0,1),rand5∈(1,Length);3.6.2)根据<img file="FDA0000939434110000021.GIF" wi="971" he="164" />执行交叉过程:若随机数rand4&lt;=CR,个体P<sub>trail</sub>的片段rand5替换为个体P<sub>target</sub>中对应的片段,否则直接继承个体P<sub>trail</sub>;3.7)针对目标个体P<sub>target</sub>和测试个体P<sub>trail</sub>进行选择操作,过程如下:3.7.1)计算P<sub>target</sub>和P<sub>trail</sub>的能量:E(P<sub>target</sub>)和E(P<sub>trail</sub>);3.7.2)若E(P<sub>target</sub>)&gt;E(P<sub>trail</sub>)则用P<sub>trail</sub>替换P<sub>target</sub>,进入3.8);3.8)i=i+1;3.9)迭代的运行3.1)~3.8),至满足终止条件。
地址 310014 浙江省杭州市下城区朝晖六区潮王路18号浙江工业大学