发明名称 一种大规模标注lncRNA功能的方法
摘要 本发明公开了一种大规模标注lncRNA功能的方法,根据lncRNA‑蛋白质的共表达数据及相互作用数据、lncRNA的表达谱数据和蛋白质的相互作用数据,构建一个全局的异构无向图,通过Katz度量计算lncRNA顶点和蛋白质顶点的相似性,从而依据相似蛋白质的功能标注信息对未知的lncRNA进行功能标注。本发明与现有的技术相比,在考虑lncRNA‑蛋白质共表达信息的基础上,也整合了lncRNA‑蛋白质相互作用数据、lncRNA的表达谱数据和蛋白质的相互作用数据。独立测试表明,本发明预测的召回率、准确性和F‑measure都比其它的方法更高,效果更好。由于本发明是一种基于图的全局计算方法,所以可以一次标注出大量的lncRNA,有效的克服了以前局部方法一次只能标注少量lncRNA功能的问题。
申请公布号 CN106446601A 申请公布日期 2017.02.22
申请号 CN201610406692.9 申请日期 2016.06.12
申请人 中南大学 发明人 张祖平;邓磊;张敬普
分类号 G06F19/18(2011.01)I 主分类号 G06F19/18(2011.01)I
代理机构 长沙朕扬知识产权代理事务所(普通合伙) 43213 代理人 周志中
主权项 一种大规模标注lncRNA功能的方法,其特征在于,包括如下步骤:步骤1、根据lncRNA与蛋白质的共表达数据、相互作用数据计算lncRNA和蛋白质的皮尔逊相关系数,并根据相关系数构造lncRNA‑蛋白质关系网络;步骤2、根据lncRNA在人类24个组织或者细胞类型中的表达谱计算lncRNA之间的皮尔逊相关系数,据此构造lncRNA相似性网络;步骤3、根据蛋白质相互作用数据构造蛋白质相互作用网络,并结合lncRNA‑蛋白质和lncRNA相似性网络构建全局网络;步骤4、利用上述构建的全局网络,根据公式(1)计算lncRNA节点和蛋白质节点的Katz度量,此Katz度量代表lncRNA节点和蛋白质节点的相似性度量,Katz度量值越大,说明这个蛋白质与lncRNA越相似;步骤5、对上述步骤得到的lncRNA和蛋白质相似矩阵进行降序排列,按照分值选择其中前N个蛋白质,分别找出前N个蛋白质中每个蛋白质所对应的功能注释,对每个功能注释,根据公式(2)计算此lncRNA具有该功能的概率。
地址 410000 湖南省长沙市岳麓区岳麓山左家垅