蛋白质复合体挖掘的加权组装聚类方法,申请号CN201310104854.X-传众专利搜索

发明名称	蛋白质复合体挖掘的加权组装聚类方法
摘要	本发明公开了一种蛋白质复合体挖掘的加权组装聚类方法，包括：输入一个蛋白质相互作用网络，产生一个无向图，选择m个聚类方法应用到这个网络上，得到m个聚类结果；对每个基本聚类结果，重新生成一个特征网络，得到m个特征网络，对应m个特征矩阵；对m个特征矩阵进行合成，获取合成矩阵W：<img file="DDA00002981612400011.GIF" wi="314" he="143" />其中u<sub>q</sub>是第q个特征网络的权重，u<sub>q</sub>≥0，且满足<img file="DDA00002981612400012.GIF" wi="223" he="143" />合成矩阵W对应一个新的网络，其中元素W<sub>i,j</sub>是度量新网络中蛋白质i和蛋白质j的相似程度；采用贝叶斯非负矩阵分解算法挖掘该新网络中的聚类；把权重的学和复合体发现整合为一个优化目标，从而通过聚类结果来优化权重，反之用权重结果来指导聚类；优化终止后获取最终的蛋白质复合体挖掘结果。
申请公布号	CN103235900A	申请公布日期	2013.08.07
申请号	CN201310104854.X	申请日期	2013.03.28
申请人	中山大学	发明人	欧阳乐;戴道清;张晓飞
分类号	G06F19/12(2011.01)I	主分类号	G06F19/12(2011.01)I
代理机构	广州粤高专利商标代理有限公司 44102	代理人	林丽明
主权项	1.一种蛋白质复合体挖掘的加权组装聚类方法，其特征在于，包括：S1.输入一个蛋白质相互作用网络，产生一个无向图G，选择m个聚类方法应用到这个网络上，得到m个聚类结果B<sub>q</sub>，q=1,...,m；B=(B<sub>1</sub>,B<sub>2</sub>,...,B<sub>m</sub>)；S2.对每个基本聚类结果B<sub>q</sub>，q=1,...,m；重新生成一个特征网络，得到m个特征网络；m个特征网络对应m个特征矩阵；D=(D<sub>1</sub>,D<sub>2</sub>,...,D<sub>m</sub>)；S3.对上述m个特征矩阵进行加权组合，获取蛋白质相互作用网络的合成矩阵W：<img file="FDA00002981612100011.GIF" wi="314" he="149" />其中u<sub>q</sub>是第q个特征网络的权重，u<sub>q</sub>≥0，q=1,...,m且满足<maths num="0001"><![CDATA[<math><mrow><munderover><mi>Σ</mi><mrow><mi>q</mi><mo>=</mo><mn>1</mn></mrow><mi>m</mi></munderover><msub><mi>u</mi><mi>q</mi></msub><mo>=</mo><mn>1</mn><mo>;</mo></mrow></math>]]></maths>S4.合成矩阵W对应一个新的网络，其中元素W<sub>i,j</sub>是度量新网络中蛋白质i和蛋白质j的相似程度；采用贝叶斯非负矩阵分解算法挖掘该新网络中的聚类；把权重的学习和复合体发现整合为一个优化目标，从而可以通过聚类结果来优化权重，反之可以用权重结果来指导聚类；优化终止后获取最终的蛋白质复合体挖掘结果。
地址	510275 广东省广州市新港西路135号中山大学