发明名称 基于亚细胞定位特异性的关键蛋白质识别方法
摘要 本发明公开了一种基于亚细胞定位特异性的关键蛋白质识别方法,包括以下步骤:步骤1:建立亚细胞定位的蛋白质相互作用子网;步骤2:衡量各个蛋白质亚细胞定位相互作用子网的蛋白质关键性得分的可信度;步骤3:计算所有蛋白质的关键性综合得分:步骤4:输出结果:对细胞内所有蛋白质按关键性综合得分排序并输出排序结果。该基于亚细胞定位特异性的关键蛋白质识别方法在关键蛋白质的识别方面准确性高、敏感度高。
申请公布号 CN104156634A 申请公布日期 2014.11.19
申请号 CN201410399693.6 申请日期 2014.08.14
申请人 中南大学 发明人 王建新;彭小清;李敏;罗军伟;钟坚成
分类号 G06F19/18(2011.01)I 主分类号 G06F19/18(2011.01)I
代理机构 长沙市融智专利事务所 43114 代理人 黄美成
主权项 一种基于蛋白质亚细胞定位特异性的关键蛋白质识别方法,其特征在于,包括以下步骤:步骤1:建立亚细胞定位的蛋白质相互作用子网;输入一组蛋白质的亚细胞定位信息和一组蛋白质相互作用数据,其中蛋白质的亚细胞定位信息包括细胞骨架、细胞核、内质网、细胞质、高尔基体、线粒体、核内体、细胞膜、溶酶体、细胞外基质和液泡共11种亚细胞定位信息;首先在蛋白质相互作用数据中去掉重复相互作用和自相互作用的数据;然后依据亚细胞定位信息以及经过上述处理后的蛋白质相互作用数据构建11个蛋白质亚细胞定位相互作用子网;步骤2:衡量各个蛋白质亚细胞定位相互作用子网的蛋白质关键性得分的可信度;根据各个蛋白质亚细胞定位相互作用子网的规模,给每个蛋白质亚细胞定位相互作用子网的蛋白质关键性得分的可信度进行打分,可信度的计算公式如下:<img file="FDA0000553938410000011.GIF" wi="401" he="173" />其中,|S<sub>i</sub>|为子网S<sub>i</sub>中蛋白质的数目,|S<sub>max</sub>|为子网S<sub>max</sub>中蛋白质的数目,S<sub>max</sub>是包含有最多蛋白质的子网;步骤3:计算所有蛋白质的关键性综合得分:将细胞内所有蛋白质的关键性综合得分初始化为0;基于蛋白质在蛋白质亚细胞定位相互作用子网的关键性得分以及不同蛋白质亚细胞定位相互作用子网的蛋白质关键性得分的可信度,按可信度的从高到底依次更新各个子网中的蛋白质的关键性综合得分;关键性综合得分的更新公式为:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>C</mi><mo>_</mo><mi>Ess</mi><mrow><mo>(</mo><mi>p</mi><mo>)</mo></mrow><mo>=</mo><mfenced open='{' close=''><mtable><mtr><mtd><mi>C</mi><mo>_</mo><mi>Ess</mi><mrow><mo>(</mo><mi>p</mi><mo>)</mo></mrow></mtd><mtd><mi>C</mi><mo>_</mo><mi>Ess</mi><mrow><mo>(</mo><mi>p</mi><mo>)</mo></mrow><mo>&GreaterEqual;</mo><mi>Ess</mi><mrow><mo>(</mo><msub><mi>S</mi><mi>i</mi></msub><mo>,</mo><mi>p</mi><mo>)</mo></mrow></mtd></mtr><mtr><mtd><mi>C</mi><mo>_</mo><mi>Ess</mi><mrow><mo>(</mo><mi>p</mi><mo>)</mo></mrow><mo>+</mo><mrow><mo>(</mo><mi>S</mi><mo>_</mo><mi>Ess</mi><mrow><mo>(</mo><msub><mi>S</mi><mi>i</mi></msub><mo>,</mo><mi>p</mi><mo>)</mo></mrow><mo>-</mo><mi>C</mi><mo>_</mo><mi>Ess</mi><mrow><mo>(</mo><mi>p</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>*</mo><mi>P</mi><mrow><mo>(</mo><msub><mi>S</mi><mi>i</mi></msub><mo>)</mo></mrow></mtd><mtd><mi>otherwise</mi><mo>;</mo></mtd></mtr></mtable></mfenced></mrow>]]></math><img file="FDA0000553938410000012.GIF" wi="1713" he="171" /></maths>其中,S_Ess(S<sub>i</sub>,p)是采用中心性方法在蛋白质亚细胞定位相互作用子网S<sub>i</sub>上计算的蛋白质p的关键性得分;P(S<sub>i</sub>)为子网S<sub>i</sub>的蛋白质关键性得分的可信度;步骤4:输出结果:对细胞内所有蛋白质按关键性综合得分排序并输出排序结果。
地址 410083 湖南省长沙市岳麓区麓山南路932号