主权项 |
一种基于级联神经网络结构的蛋白质关联图的预测方法,采用6个神经网络子网以及由该6个神经网络子网形成的1个级联网络的结构,其特征在于该方法具体步骤如下:A.建立标准的6个神经网络子网及1个级联网络,所述的每个神经网络子网由输入层、中间隐含层及输出层组成;B.读取蛋白质数据集,并依据蛋白质长度进行分类,将蛋白质长度在51‑70之间的蛋白质数据划为数据子集1,长度在71‑90之间的蛋白质数据划为数据子集2, 长度在91‑130之间的蛋白质数据划为数据子集3,长度在131‑190之间的蛋白质数据划为数据子集4, 长度在191‑290之间的蛋白质数据划为数据子集5, 长度在291‑450之间的蛋白质数据划为数据子集6;从每个数据子集随机选取50个蛋白质数据作为训练集,剩余作为测试集,最终得到6个训练集和6个测试集;C.采用反向传播算法,使用6个训练集对相应的6个神经网络子网进行训练学习,得到训练后的6个神经网络子网;D.分别使用6个训练集及步骤C所得训练后的6个神经网络子网对级联神经网络进行训练学习,得到最终可用于蛋白质关联图预测的级联神经网络;E.将步骤B所得6个测试集中的待预测蛋白质进行编码,依次将编码后的每个蛋白质数据对应输入到步骤C所得的训练后的神经网络子网组进行级联网络结构中第一层预测,得到该蛋白质初步的关联图;重复本步骤,直到完成测试集中所有蛋白质的第一层预测;F.将步骤E所得的蛋白质初步的关联图输入至级联神经网络,得到蛋白质最终的关联图。 |