发明名称 一种基于萤火虫算法的蛋白质结构预测从头方法
摘要 一种基于萤火虫算法的蛋白质结构预测从头方法,在基本萤火虫算法框架下,采用粗粒度能量模型来有效降低构象空间维数,利用萤火虫算法的群体特性来保证蛋白质构象的多样性,采用片段组装技术对构象群体进行初始化,依据蛋白质构象的粗粒度表达模型,以一组二面角表示构象在空间中的位置,采用能量排名来确定最强发光个体,并通过计算个体间的吸引度来更新构象的位置,最终在构象空间中搜索得到最小能量的近天然态构象。本发明在蛋白质结构预测中应用,可以得到预测精度较高、复杂度较低的构象。
申请公布号 CN106446604A 申请公布日期 2017.02.22
申请号 CN201610908691.4 申请日期 2016.10.19
申请人 浙江工业大学 发明人 张贵军;郝小虎;周晓根;王柳静;李章维
分类号 G06F19/18(2011.01)I;G06N3/00(2006.01)I 主分类号 G06F19/18(2011.01)I
代理机构 杭州斯可睿专利事务所有限公司 33241 代理人 王利强
主权项 一种基于萤火虫算法的蛋白质结构预测从头方法,其特征在于:所述方法包括以下步骤:1)给定输入序列信息;2)参数初始化:设置群体规模popSize,迭代次数generation,光强吸引因子γ,位置更新步长因子α;3)群体构象初始化:根据给定输入序列,随机生成popSize个个体,对群体中的每个个体做length次片段组装,并计算其荧光亮度Io,其中length为序列长度,Io=‑E,E为通过RosettaSscore3能量函数计算得到的蛋白质构象能量值;4)对步骤3)中计算的荧光亮度从大到小排序,令荧光亮度最大的个体为p<sub>g</sub>;5)开始迭代:5.1)对群体中的每个个体,计算p<sub>g</sub>对它的吸引度β;5.2)根据x<sub>i</sub>(t+1)=x<sub>i</sub>(t)+β(x<sub>j</sub>(t)–x<sub>i</sub>(t))+α(rand–0.5)更新每个个体在空间中的位置,其中x<sub>i</sub>(t+1),x<sub>i</sub>(t)表示个体p<sub>i</sub>更新后的位置和当前的位置,x<sub>j</sub>(t)表示个体p<sub>g</sub>的当前位置,其中<img file="FDA0001133702800000011.GIF" wi="299" he="79" />β<sub>0</sub>为最大吸引度因子,r<sub>ij</sub>表示个体p<sub>i</sub>与p<sub>g</sub>之间的距离,rand为0到1之间的随机数,群体中每个个体的位置x<sub>i</sub>(t)表示为<img file="FDA0001133702800000012.GIF" wi="779" he="62" /><img file="FDA0001133702800000013.GIF" wi="88" he="47" />为输入序列的氨基酸残基的二面角,L为片段长度;5.3)对群体中的每个个体进行L次随机片段组装,完成群体随机摆动;5.4)重新计算每个个体的荧光亮度,更新p<sub>g</sub>;6)判断是否达到最大迭代次数generation;6.1)若当前迭代次数小于generation,返回步骤5.1);6.2)若当前迭代次数等于generation,结束。
地址 310014 浙江省杭州市下城区潮王路18号浙江工业大学