发明名称 基于级联神经网络结构的蛋白质关联图的预测方法
摘要 本发明涉及一种基于级联神经网络结构的蛋白质关联图的预测方法。该方法步骤如下,如附图1:A.建立6个神经网络子网及1个级联神经网络;B.读取蛋白质数据集,并依据蛋白质长度对数据集进行分类;C.采用反向传播算法对神经网络子网进行训练学;D.对级联神经网络进行训练学;E.进行第一层神经网络子网的预测;F.完成第二层级联神经网络的预测,得到最终的蛋白质关联图。该方法采用多神经网络并形成级联结构进行预测,1.因此克服了单神经网络方法无法针对不同长度蛋白质优化处理的缺陷,提高了预测精度和稳定性;2.具有内在并行特质,各子网及级联网络可并行处理,提高计算效率。
申请公布号 CN104951668A 申请公布日期 2015.09.30
申请号 CN201510160212.0 申请日期 2015.04.07
申请人 上海大学 发明人 谢江;丁旺;王旻超;马进;谢昊;戴东波;张惠然;郭毅可;张武
分类号 G06F19/16(2011.01)I 主分类号 G06F19/16(2011.01)I
代理机构 上海上大专利事务所(普通合伙) 31205 代理人 陆聪明
主权项 一种基于级联神经网络结构的蛋白质关联图的预测方法,采用6个神经网络子网以及由该6个神经网络子网形成的1个级联网络的结构,其特征在于该方法具体步骤如下:A.建立标准的6个神经网络子网及1个级联网络,所述的每个神经网络子网由输入层、中间隐含层及输出层组成;B.读取蛋白质数据集,并依据蛋白质长度进行分类,将蛋白质长度在51‑70之间的蛋白质数据划为数据子集1,长度在71‑90之间的蛋白质数据划为数据子集2, 长度在91‑130之间的蛋白质数据划为数据子集3,长度在131‑190之间的蛋白质数据划为数据子集4, 长度在191‑290之间的蛋白质数据划为数据子集5, 长度在291‑450之间的蛋白质数据划为数据子集6;从每个数据子集随机选取50个蛋白质数据作为训练集,剩余作为测试集,最终得到6个训练集和6个测试集;C.采用反向传播算法,使用6个训练集对相应的6个神经网络子网进行训练学习,得到训练后的6个神经网络子网;D.分别使用6个训练集及步骤C所得训练后的6个神经网络子网对级联神经网络进行训练学习,得到最终可用于蛋白质关联图预测的级联神经网络;E.将步骤B所得6个测试集中的待预测蛋白质进行编码,依次将编码后的每个蛋白质数据对应输入到步骤C所得的训练后的神经网络子网组进行级联网络结构中第一层预测,得到该蛋白质初步的关联图;重复本步骤,直到完成测试集中所有蛋白质的第一层预测;F.将步骤E所得的蛋白质初步的关联图输入至级联神经网络,得到蛋白质最终的关联图。
地址 200444 上海市宝山区上大路99号