发明名称 一种基于阶段性多策略副本交换的蛋白质结构预测方法
摘要 一种基于阶段性多策略副本交换的蛋白质结构预测方法,在差分进化算法(DE)的框架下,首先,在每个温度层中生成具有多样化折叠类型的初始构象种群;然后,对每个温度层,根据迭代次数将构象搜索分为两个阶段,第一个阶段从种群中随机选取一个构象作为目标个体,第二个阶段根据能量将种群分为两个部分,从能量低的前50%的种群中随机选取一个个体作为目标个体;之后,随机选取与目标个体不一样的三个构象个体经过变异、交叉和片段组装策略生成测试个体,并根据构象的能量判断是否接受测试个体,进而将相邻的温度层的对应个体进行副本交换;在阶段性策略的指导下,辅以副本交换策略,通过不断更新种群获得一系列亚稳态构象。
申请公布号 CN106055920A 申请公布日期 2016.10.26
申请号 CN201610390366.3 申请日期 2016.06.02
申请人 浙江工业大学 发明人 张贵军;俞旭锋;周晓根;郝小虎;王柳静
分类号 G06F19/16(2011.01)I 主分类号 G06F19/16(2011.01)I
代理机构 杭州斯可睿专利事务所有限公司 33241 代理人 王利强
主权项 一种基于阶段性多策略副本交换的蛋白质结构预测方法,其特征在于:所述预测方法包括以下步骤:1)给定查询序列信息;2)初始化:设置群体规模NP,变异因子F,交叉概率CR,n个温度层T,迭代次数iteration,片段长度为L,能量函数选用Rosetta Score3,首先通过对查询序列随机的折叠和变换,在每个温度层生成一个规模为NP的初始构象种群,初始群体为P={x<sup>i</sup>|i∈I},计算初始种群构象个体的能量值f(x<sup>i</sup>),i∈I,并设<img file="FDA0001007967070000011.GIF" wi="341" he="78" />其中i为种群个体编号,I为种群个体编号集合,I={1,2,...,NP},<img file="FDA0001007967070000012.GIF" wi="60" he="65" />为对应温度层能量函数值中的最小值,T为温度层;3)开始迭代,依次对每个温度层种群中的每个个体进行以下操作:3.1)令g=1,g为迭代计数器;3.2)随机选取种群中的一个构象个体x<sup>i</sup>,i∈{1,2,3,…,NP},令P<sub>target</sub>=x<sup>i</sup>,P<sub>target</sub>表示目标构象个体,执行以下操作得到变异构象P<sub>mutant</sub>;3.3)随机生成正整数rand1,rand2,rand3∈{1,2,3,......NP},且rand1≠rand2≠rand3≠i,令P<sub>rand1</sub>=x<sup>rand1</sup>,P<sub>rand2</sub>=x<sup>rand2</sup>,P<sub>rand3</sub>=x<sup>rand3</sup>;再生成4个随机整数randrange1,randrange2,randrange3,randrange4;其中randrange1≠randrange2,randrange3≠randrange4∈{1,2,…,Length},Length为序列长度;3.4)令a=min(randrange1,randrange2),b=max(randrange1,randrange2);令c=min(randrange3,randrange4),d=max(randrange3,randrange4);其中min表示取两个数的最小值,max表示取两个数的最大值;3.5)如果g≤iteration/2,用P<sub>rand2</sub>上位置a到位置b的片段的氨基酸所对应的二面角phi、psi、omega替换P<sub>rand1</sub>的相同位置所对应的二面角phi、psi、omega;再使用P<sub>rand3</sub>上位置c到位置d的片段的氨基酸所对应的二面角phi、psi、omega替换P<sub>rand1</sub>上相同位置所对应的二面角phi、psi、omega,再将所得P<sub>rand1</sub>进行片段组装得到变异个体P<sub>mutant</sub>,跳转至3.7);3.6)如果iteration/2&lt;g&lt;iteration,则执行如下操作:3.6.1)根据能量对整个种群中的构象进行降序排列,然后从能量低的前NP/2个构象个体中随机选出一个构象记为P<sub>pbest</sub>;3.6.2)用P<sub>rand2</sub>上位置a到位置b的片段的氨基酸所对应的二面角phi、psi、omega替换P<sub>rand1</sub>的相同位置所对应的二面角phi、psi、omega;再使用P<sub>rand3</sub>上位置c到位置d的片段的氨基酸所对应的二面角phi、psi、omega替换P<sub>pbest</sub>上相同位置所对应的二面角phi、psi、omega,再将所得P<sub>rand1</sub>进行片段组装得到变异个体P<sub>mutant</sub>;3.7)针对变异个体P<sub>mutant</sub>做交叉操作,过程如下:3.7.1)生成随机数rand4,rand5,其中rand4∈(0,1),rand5∈(1,Length);3.7.2)根据<img file="FDA0001007967070000021.GIF" wi="1006" he="157" />执行交叉过程:若随机数rand4≤CR,个体P<sub>mutant</sub>的片段rand5替换为个体P<sub>target</sub>中对应的片段,否则直接继承变异个体得到测试个体P<sub>trail</sub>;3.8)针对每个温度层中的目标个体P<sub>target</sub>和测试个体P<sub>trail</sub>进行选择操作:3.8.1)计算P<sub>target</sub>和P<sub>trail</sub>的能量:E(P<sub>target</sub>)和E(P<sub>trail</sub>);3.8.2)若E(P<sub>target</sub>)&gt;E(P<sub>trail</sub>)则用P<sub>trail</sub>替换P<sub>target</sub>,进入3.8);4)在每个温度层都进行变异、交叉和选择更新完种群后,将相邻温度层中对应的个体进行副本交换:4.1)首先选择种群中第i个个体,i∈I(i=1,2,…,NP);4.2)选择两个相邻的温度层T<sub>j</sub>和T<sub>j+1</sub>,j=1,2,…,n;4.3)产生一个随机数randx∈(0,1)和判别数:<maths num="0001"><math><![CDATA[<mrow><mi>j</mi><mi>u</mi><mi>d</mi><mi>g</mi><mi>e</mi><mo>=</mo><msup><mi>e</mi><mrow><mo>(</mo><mrow><mfrac><mn>1</mn><mrow><mo>(</mo><mi>K</mi><mo>&times;</mo><mo>(</mo><msub><mi>T</mi><mrow><mi>j</mi><mo>+</mo><mn>1</mn></mrow></msub><mo>)</mo><mo>)</mo></mrow></mfrac><mo>-</mo><mfrac><mn>1</mn><mrow><mi>K</mi><mo>&times;</mo><msub><mi>T</mi><mi>j</mi></msub></mrow></mfrac><mo>)</mo><mo>&times;</mo><mo>(</mo><mrow><mi>f</mi><mrow><mo>(</mo><msubsup><mi>x</mi><msub><mi>T</mi><mrow><mi>j</mi><mo>+</mo><mn>1</mn></mrow></msub><mi>i</mi></msubsup><mo>)</mo></mrow><mo>-</mo><mi>f</mi><mrow><mo>(</mo><msubsup><mi>x</mi><msub><mi>T</mi><mi>j</mi></msub><mi>i</mi></msubsup><mo>)</mo></mrow></mrow><mo>)</mo></mrow><mo>)</mo></mrow></msup></mrow>]]></math><img file="FDA0001007967070000022.GIF" wi="694" he="141" /></maths>其中,<img file="FDA0001007967070000023.GIF" wi="53" he="77" />表示在T<sub>j</sub>个温度层中第i个个体,其中i=1,2,…,NP,<img file="FDA0001007967070000024.GIF" wi="134" he="78" />为种群个体<img file="FDA0001007967070000025.GIF" wi="51" he="77" />的能量值,K为玻尔兹曼常数,T<sub>j</sub>(j=1,2,…,n)为第j个温度层的开尔文温度,j为索引编号,e为自然常数;4.4)若randx<judge,将相邻温度层中的<img file="FDA0001007967070000026.GIF" wi="75" he="78" />和<img file="FDA0001007967070000027.GIF" wi="59" he="77" />个体进行交换;5)判断是否满足终止条件,如不满足则转至3);若满足则输出结果。
地址 310014 浙江省杭州市下城区朝晖六区潮王路18号