发明名称 一种结构域映射蛋白相互作用组的定量分析方法
摘要 本发明属蛋白质组学生物信息学领域,涉及一种结构域映射蛋白相互作用组的定量分析方法。本发明利用“双标签”蛋白质组学技术定量化检测蛋白质相互作用,并通过所鉴定到蛋白质的结构域和定量信息即相互作用程度来分别进行双边聚类和可视化分析,最终得到了靶蛋白相互作用网络中全体蛋白质独特的、多层次的、合理的结构及功能分类,表现出蛋白质通过特定的结构域以及与靶蛋白不同的相互作用程度来响应特定细胞过程的生物学意义。适用于对相互作用蛋白质数据的大规模分析。
申请公布号 CN101881766B 申请公布日期 2013.05.29
申请号 CN200910050944.9 申请日期 2009.05.08
申请人 复旦大学 发明人 陈先;邹鹏;罗凯旋;
分类号 G01N33/53(2006.01)I;G06N1/00(2006.01)I 主分类号 G01N33/53(2006.01)I
代理机构 上海元一成知识产权代理事务所(普通合伙) 31268 代理人 吴桂琴
主权项 一种结构域映射蛋白相互作用组的定量分析方法,其特征在于,利用蛋白质组学技术定量化鉴定蛋白相互作用得其结构域特征,对该结构域特征进行双边聚类分析,得所述蛋白质聚类矩阵,再结合所述蛋白质对应的定量信息对所述的聚类分析图谱进行差异定量可视化的处理,获得对蛋白相互作用网络中蛋白质的结构及功能分类;其包括步骤:1)采用“双标签”定量蛋白质组学技术对蛋白复合物即相互作用蛋白进行定性鉴定和定量分析,得到与靶蛋白相互作用蛋白的名称和对应的结合程度即定量数据,所述的“双标签”定量蛋白质组学技术为表位标签和稳定同位素标记氨基酸标签技术,其中的表位标签为Flag;稳定同位素标记氨基酸标签为氘代亮氨酸d3‑Leu;2)从蛋白质结构域数据库中获得步骤1所鉴定的所有相互作用蛋白的结构域,所述的结构域数据库为Simple Modular Architecture Research Tool和Protein Family Database;3)将步骤2的所有结构域名称混合并按字母顺序排列作为列,将所有鉴定到的蛋白名称作为行,用步骤1得到的每个蛋白质的定量数据表示相应各个蛋白所有结构域的定量数值,用零代表不存在的结构域,最后生成蛋白质×结构域的数据矩阵;4)采用蛋白结构域的相关系数作为样本相似性测度,用最小距离法作为类间相似度依据,对蛋白及其结构域进行双边聚类分析,用树形图反映不同蛋白和不同结构域的系统聚类结构关系,所述的蛋白功能结构域的相关系数的相似度计算公式为: <mrow> <msub> <mi>d</mi> <mi>rs</mi> </msub> <mo>=</mo> <mn>1</mn> <mo>-</mo> <mfrac> <mrow> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>r</mi> </msub> <mo>-</mo> <msub> <mover> <mi>x</mi> <mo>-</mo> </mover> <mi>r</mi> </msub> <mo>)</mo> </mrow> <msup> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>s</mi> </msub> <mo>-</mo> <msub> <mover> <mi>x</mi> <mo>-</mo> </mover> <mi>s</mi> </msub> <mo>)</mo> </mrow> <mo>&prime;</mo> </msup> </mrow> <mrow> <msup> <mrow> <mo>[</mo> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>r</mi> </msub> <mo>-</mo> <msub> <mover> <mi>x</mi> <mo>-</mo> </mover> <mi>r</mi> </msub> <mo>)</mo> </mrow> <msup> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>r</mi> </msub> <mo>-</mo> <msub> <mover> <mi>x</mi> <mo>-</mo> </mover> <mi>r</mi> </msub> <mo>)</mo> </mrow> <mo>&prime;</mo> </msup> <mo>]</mo> </mrow> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> </msup> <msup> <mrow> <mo>[</mo> <mo></mo> <msup> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>s</mi> </msub> <mo>-</mo> <msub> <mover> <mi>x</mi> <mo>-</mo> </mover> <mi>s</mi> </msub> <mo>)</mo> <mo>(</mo> <msub> <mi>x</mi> <mi>s</mi> </msub> <mo>-</mo> <msub> <mover> <mi>x</mi> <mo>-</mo> </mover> <mi>s</mi> </msub> <mo>)</mo> </mrow> <mo>&prime;</mo> </msup> <mo>]</mo> </mrow> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> </msup> </mrow> </mfrac> </mrow>其中, <mrow> <msub> <mover> <mi>x</mi> <mo>-</mo> </mover> <mi>r</mi> </msub> <mo>=</mo> <mfrac> <mn>1</mn> <mi>n</mi> </mfrac> <munder> <mi>&Sigma;</mi> <mi>j</mi> </munder> <msub> <mi>x</mi> <mrow> <mi>rj</mi> <mo>,</mo> </mrow> </msub> </mrow> <mrow> <msub> <mover> <mi>x</mi> <mo>-</mo> </mover> <mi>s</mi> </msub> <mo>=</mo> <mfrac> <mn>1</mn> <mi>n</mi> </mfrac> <munder> <mi>&Sigma;</mi> <mi>j</mi> </munder> <msub> <mi>x</mi> <mi>sj</mi> </msub> <mo>;</mo> </mrow>最小距离法计算公式为:d(r,s)=min(dist(xri,xsj)),i∈(i,,...,nr),j∈(1j...,ns);所述双边聚类算法包括步骤:(1)计算每类间的相似度,形成相似度矩阵;(2)在相似度矩阵中寻找最相似的元素,合并行列对应的聚合类;(3)重新计算新的聚合类之间的相似度,形成新的相似度矩阵;(4)返回第2步,直至所有模式样本被聚合为一类,或聚合到规定的类别数,或所有类别间距离均大于给定的相似度阈值;(5)使用树形图反映蛋白功能结构域的系统聚类结构关系;5)用灰度梯度图来可视化的展示相互作用蛋白的聚类模式。
地址 200433 上海市邯郸路220号