发明名称 基于分形特征的复杂网络社区发现方法
摘要 基于分形特征的复杂网络社区发现方法,包括离线的静态复杂网络的社区发现的处理和在线动态复杂网络的社区发现的处理两个阶段。本发明充分利用复杂网络的多尺度特征,用重正化过程作为联系不同尺度间的桥梁,从而达到将之前的社区结构信息为新的社区结构发现所用的目的,实现了增量式的社区发现,为研究动态复杂网络的社区结构做了新的尝试,并得到了比较满意的结果。
申请公布号 CN103425868B 申请公布日期 2016.12.28
申请号 CN201310277772.5 申请日期 2013.07.04
申请人 西安理工大学 发明人 吕林涛;申冰;孙飞龙;谭芳
分类号 G06F19/00(2011.01)I 主分类号 G06F19/00(2011.01)I
代理机构 西安弘理专利事务所 61214 代理人 李娜
主权项 基于分形特征的复杂网络社区发现方法,其特征在于:包括离线的静态复杂网络的社区发现的处理和在线动态复杂网络的社区发现的处理两个阶段,其中,第一阶段离线的静态复杂网络的社区发现的处理,其过程如下:步骤1、输入复杂网络的拓扑结构G=(V,E);复杂网络用无向图G=(V,E)来表示,V和E分别为结点和边的集合;步骤2、初始化,具体为,计算V中每个结点的度,结点n<sub>i</sub>的度记为deg<sub>i</sub>,表示网络中连接到结点的边的个数;对E中的每条边设定权值w<sub>ij</sub>,若n<sub>i</sub>和n<sub>j</sub>有一个度为1,则令其权值为0,其它情况权值为1;令重正化次数k=0,并令d=0,d<sub>k</sub>=0,C(d)<sub>k</sub>=0,其中,d是社区两节点间最小距离,第一次d=0,d<sub>k</sub>是为社区两节点的叠加距离,d<sub>k</sub>=0指在k=0的情况下,d<sub>k</sub>赋给0值,C(d)<sub>k</sub>是社区两节点的关联函数,在k=0次的情况下C(d)<sub>k</sub>赋给0值;步骤3、计算相邻结点的距离,重正化距离最小的结点,具体为:若复杂网络中所有的原始点都已经被重正化过,则跳至步骤4更新网络,否则继续此步骤;依据式(1)计算所有相邻结点的距离:<maths num="0001"><math><![CDATA[<mrow><mo>|</mo><mo>|</mo><msub><mi>n</mi><mi>i</mi></msub><mo>-</mo><msub><mi>n</mi><mi>j</mi></msub><mo>|</mo><mo>|</mo><mo>=</mo><mfrac><mn>1</mn><mrow><mo>|</mo><msub><mi>deg</mi><mi>i</mi></msub><mo>-</mo><msub><mi>deg</mi><mi>j</mi></msub><mo>|</mo><mo>+</mo><mn>1</mn></mrow></mfrac><mo>&CenterDot;</mo><mi>m</mi><mi>i</mi><mi>n</mi><mo>{</mo><msub><mi>deg</mi><mi>i</mi></msub><mo>,</mo><msub><mi>deg</mi><mi>j</mi></msub><mo>}</mo><mo>&CenterDot;</mo><msub><mi>w</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>,</mo><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0001041403770000011.GIF" wi="1485" he="127" /></maths>其中,deg<sub>i</sub>,deg<sub>j</sub>分别表示结点n<sub>i</sub>,n<sub>j</sub>的度,min{x,y}表示取较小的一个值;w<sub>ij</sub>表示给边(n<sub>i</sub>,n<sub>j</sub>)的权值;取所有边中距离的最小值d,将所有距离为d的边的端点进行重正化;在这里重正化采用的是最多最先处理的原则,即先处理拥有最短距离边数最多的点,先将此点的相邻最短的边所涉及的点进行重正化,即将其合并为一个点;重复此过程直到距离为d的边都被处理过;计算距离:d<sub>k</sub>=d<sub>k‑1</sub>+d                            (2)和关联函数C(d)<sub>k</sub>:<maths num="0002"><math><![CDATA[<mrow><mi>C</mi><msub><mrow><mo>(</mo><mi>d</mi><mo>)</mo></mrow><mi>k</mi></msub><mo>=</mo><mfrac><mn>1</mn><msup><mi>N</mi><mn>2</mn></msup></mfrac><msubsup><mi>&Sigma;</mi><mrow><mi>i</mi><mo>,</mo><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></msubsup><mi>H</mi><mrow><mo>(</mo><mi>d</mi><mo>-</mo><mo>|</mo><mo>|</mo><msub><mi>n</mi><mi>i</mi></msub><mo>-</mo><msub><mi>n</mi><mi>j</mi></msub><mo>|</mo><mo>|</mo><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0001041403770000021.GIF" wi="1238" he="102" /></maths>其中,N为网络中结点的个数,n<sub>i</sub>,n<sub>j</sub>为网络中的结点;H(y)为阶跃函数(step function),即<maths num="0003"><math><![CDATA[<mrow><mi>H</mi><mrow><mo>(</mo><mi>y</mi><mo>)</mo></mrow><mo>=</mo><mfenced open = "{" close = ""><mtable><mtr><mtd><mn>1</mn></mtd><mtd><mrow><mi>y</mi><mo>&GreaterEqual;</mo><mn>0</mn></mrow></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mrow><mi>y</mi><mo>&lt;</mo><mn>0</mn></mrow></mtd></mtr></mtable></mfenced><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>4</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0001041403770000022.GIF" wi="1245" he="127" /></maths>令k=k+1;步骤4、更新网络,具体为:经过步骤2的重正化后,每条边的权值w<sub>ij</sub>则按下面的策略来计算:首先令所有的权值都为1;如果此时n<sub>i</sub>和n<sub>j</sub>经过上一步重正化前有s个边相连,则w<sub>ij</sub>=w<sub>ij</sub>/s;若n<sub>i</sub>和n<sub>j</sub>有一个的度为1,且其所代表的点有m个,即它由m个点重正化而来,则w<sub>ij</sub>=w<sub>ij</sub>*m;步骤5、输出结果:画图估计复杂网络的分形维数并给出其关联维数的值;网络的关联维数定义如下:<maths num="0004"><math><![CDATA[<mrow><msub><mi>D</mi><mi>C</mi></msub><mo>=</mo><munder><mi>lim</mi><mrow><mi>d</mi><mo>&RightArrow;</mo><mn>0</mn></mrow></munder><mfrac><mrow><mi>ln</mi><mi> </mi><mi>C</mi><mrow><mo>(</mo><mi>d</mi><mo>)</mo></mrow></mrow><mrow><mi>ln</mi><mi> </mi><mi>d</mi></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>5</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0001041403770000023.GIF" wi="1222" he="103" /></maths>1)K个不同的社区{D<sub>i</sub>}(i=1…K),其中<img file="FDA0001041403770000024.GIF" wi="203" he="134" />对于<img file="FDA0001041403770000025.GIF" wi="369" he="79" />2)一系列(C(d),d)点对的值及由此估计出的复杂网络分形维数D<sub>c</sub>。
地址 710048 陕西省西安市金花南路5号