发明名称 预测长链非编码RNA和蛋白质联系的方法及系统
摘要 本发明涉及生物信息技术领域,公开一种预测长链非编码RNA和蛋白质联系的方法及系统,以确保预测的准确度,节省实验成本。该方法包括:构建lncRNA‑蛋白质相互联系的子网一、lncRNA‑lncRNA相互联系的子网二以及蛋白质‑蛋白质相互联系的子网三;将各子网组合构造成全局异构网络;确定任意lncRNA与任意蛋白质在全局异构网络中建立联系的至少两条游走路径;任一游走路径将子网一与子网二及子网三中的至少一个进行串联;通过HeteSim算法计算各游走路径的HeteSim分数;根据全局异构网络中lncRNA源端与蛋白质宿端之间的各游走路径的相应HeteSim分数进行用于预测非编码RNA和蛋白质联系的分类模型的构建及评估。
申请公布号 CN106599610A 申请公布日期 2017.04.26
申请号 CN201611085289.7 申请日期 2016.11.30
申请人 中南大学 发明人 邓磊;肖云
分类号 G06F19/18(2011.01)I 主分类号 G06F19/18(2011.01)I
代理机构 长沙朕扬知识产权代理事务所(普通合伙) 43213 代理人 何湘玲
主权项 一种预测长链非编码RNA和蛋白质联系的方法,其特征在于,包括:构建lncRNA‑蛋白质相互联系的子网一、lncRNA‑lncRNA相互联系的子网二以及蛋白质‑蛋白质相互联系的子网三;将所述子网一、子网二及子网三组合构造成全局异构网络;确定任意lncRNA与任意蛋白质在所述全局异构网络中建立联系的至少两条游走路径;任一游走路径将所述子网一与所述子网二及子网三中的至少一个进行串联;通过HeteSim算法计算各游走路径的HeteSim分数;根据所述全局异构网络中lncRNA源端与蛋白质宿端之间的各游走路径的相应HeteSim分数进行用于预测非编码RNA和蛋白质联系的分类模型的构建及评估。
地址 410000 湖南省长沙市岳麓区岳麓山左家垅