发明名称 蛋白质复合体挖掘的加权组装聚类方法
摘要 本发明公开了一种蛋白质复合体挖掘的加权组装聚类方法,包括:输入一个蛋白质相互作用网络,产生一个无向图,选择m个聚类方法应用到这个网络上,得到m个聚类结果;对每个基本聚类结果,重新生成一个特征网络,得到m个特征网络,对应m个特征矩阵;对m个特征矩阵进行合成,获取合成矩阵W:<img file="DDA00002981612400011.GIF" wi="314" he="143" />其中u<sub>q</sub>是第q个特征网络的权重,u<sub>q</sub>≥0,且满足<img file="DDA00002981612400012.GIF" wi="223" he="143" />合成矩阵W对应一个新的网络,其中元素W<sub>i,j</sub>是度量新网络中蛋白质i和蛋白质j的相似程度;采用贝叶斯非负矩阵分解算法挖掘该新网络中的聚类;把权重的学和复合体发现整合为一个优化目标,从而通过聚类结果来优化权重,反之用权重结果来指导聚类;优化终止后获取最终的蛋白质复合体挖掘结果。
申请公布号 CN103235900A 申请公布日期 2013.08.07
申请号 CN201310104854.X 申请日期 2013.03.28
申请人 中山大学 发明人 欧阳乐;戴道清;张晓飞
分类号 G06F19/12(2011.01)I 主分类号 G06F19/12(2011.01)I
代理机构 广州粤高专利商标代理有限公司 44102 代理人 林丽明
主权项 1.一种蛋白质复合体挖掘的加权组装聚类方法,其特征在于,包括:S1.输入一个蛋白质相互作用网络,产生一个无向图G,选择m个聚类方法应用到这个网络上,得到m个聚类结果B<sub>q</sub>,q=1,...,m;B=(B<sub>1</sub>,B<sub>2</sub>,...,B<sub>m</sub>);S2.对每个基本聚类结果B<sub>q</sub>,q=1,...,m;重新生成一个特征网络,得到m个特征网络;m个特征网络对应m个特征矩阵;D=(D<sub>1</sub>,D<sub>2</sub>,...,D<sub>m</sub>);S3.对上述m个特征矩阵进行加权组合,获取蛋白质相互作用网络的合成矩阵W:<img file="FDA00002981612100011.GIF" wi="314" he="149" />其中u<sub>q</sub>是第q个特征网络的权重,u<sub>q</sub>≥0,q=1,...,m且满足<maths num="0001"><![CDATA[<math><mrow><munderover><mi>&Sigma;</mi><mrow><mi>q</mi><mo>=</mo><mn>1</mn></mrow><mi>m</mi></munderover><msub><mi>u</mi><mi>q</mi></msub><mo>=</mo><mn>1</mn><mo>;</mo></mrow></math>]]></maths>S4.合成矩阵W对应一个新的网络,其中元素W<sub>i,j</sub>是度量新网络中蛋白质i和蛋白质j的相似程度;采用贝叶斯非负矩阵分解算法挖掘该新网络中的聚类;把权重的学习和复合体发现整合为一个优化目标,从而可以通过聚类结果来优化权重,反之可以用权重结果来指导聚类;优化终止后获取最终的蛋白质复合体挖掘结果。
地址 510275 广东省广州市新港西路135号中山大学