发明名称 |
一种大规模标注lncRNA功能的方法 |
摘要 |
本发明公开了一种大规模标注lncRNA功能的方法,根据lncRNA‑蛋白质的共表达数据及相互作用数据、lncRNA的表达谱数据和蛋白质的相互作用数据,构建一个全局的异构无向图,通过Katz度量计算lncRNA顶点和蛋白质顶点的相似性,从而依据相似蛋白质的功能标注信息对未知的lncRNA进行功能标注。本发明与现有的技术相比,在考虑lncRNA‑蛋白质共表达信息的基础上,也整合了lncRNA‑蛋白质相互作用数据、lncRNA的表达谱数据和蛋白质的相互作用数据。独立测试表明,本发明预测的召回率、准确性和F‑measure都比其它的方法更高,效果更好。由于本发明是一种基于图的全局计算方法,所以可以一次标注出大量的lncRNA,有效的克服了以前局部方法一次只能标注少量lncRNA功能的问题。 |
申请公布号 |
CN106446601A |
申请公布日期 |
2017.02.22 |
申请号 |
CN201610406692.9 |
申请日期 |
2016.06.12 |
申请人 |
中南大学 |
发明人 |
张祖平;邓磊;张敬普 |
分类号 |
G06F19/18(2011.01)I |
主分类号 |
G06F19/18(2011.01)I |
代理机构 |
长沙朕扬知识产权代理事务所(普通合伙) 43213 |
代理人 |
周志中 |
主权项 |
一种大规模标注lncRNA功能的方法,其特征在于,包括如下步骤:步骤1、根据lncRNA与蛋白质的共表达数据、相互作用数据计算lncRNA和蛋白质的皮尔逊相关系数,并根据相关系数构造lncRNA‑蛋白质关系网络;步骤2、根据lncRNA在人类24个组织或者细胞类型中的表达谱计算lncRNA之间的皮尔逊相关系数,据此构造lncRNA相似性网络;步骤3、根据蛋白质相互作用数据构造蛋白质相互作用网络,并结合lncRNA‑蛋白质和lncRNA相似性网络构建全局网络;步骤4、利用上述构建的全局网络,根据公式(1)计算lncRNA节点和蛋白质节点的Katz度量,此Katz度量代表lncRNA节点和蛋白质节点的相似性度量,Katz度量值越大,说明这个蛋白质与lncRNA越相似;步骤5、对上述步骤得到的lncRNA和蛋白质相似矩阵进行降序排列,按照分值选择其中前N个蛋白质,分别找出前N个蛋白质中每个蛋白质所对应的功能注释,对每个功能注释,根据公式(2)计算此lncRNA具有该功能的概率。 |
地址 |
410000 湖南省长沙市岳麓区岳麓山左家垅 |