发明名称 基于MMSB的微博网络用户行为分析方法
摘要 本发明公开了一种基于MMSB的微博网络用户行为分析方法,主要包括:设定所建立的模拟微博网络的混合隶属度<img file="DDA0000381714730000011.GIF" wi="46" he="55" />和转移概率矩阵B,创建MMSB模拟微博网络;根据所述步骤S1中建立的MMSB微博模拟网络,已知混合隶属度<img file="DDA0000381714730000012.GIF" wi="41" he="54" />和转移概率矩阵B,由模型可得出整个微博网络中任意两个节点之间的微博转发百分比p(Y)的联合概率公式;根据步骤S2中得到了微博转发百分比p(Y)的表达式,采用平均场变量方法进行分析;根据模拟微博网络实际测得的用户的微博转发百分比p(Y),以及所述步骤S3中得到的不等式,采用坐标上升算法求得微博网络实际的混合隶属度<img file="DDA0000381714730000013.GIF" wi="43" he="55" />和转移概率矩阵B。本方法用在分析微博网络用户的行为信息,能够得到更接近于实际的用户信息。
申请公布号 CN103488885A 申请公布日期 2014.01.01
申请号 CN201310418198.0 申请日期 2013.09.13
申请人 电子科技大学 发明人 胡光岷;辛佰惠;刘唯一;于富财
分类号 G06F19/00(2011.01)I 主分类号 G06F19/00(2011.01)I
代理机构 成都宏顺专利代理事务所(普通合伙) 51227 代理人 周永宏
主权项 1.基于MMSB的微博网络用户行为分析方法,其特征在于,具体包括:S1、设定所建立的模拟微博网络的混合隶属度<img file="FDA00003817147000000128.GIF" wi="37" he="50" />和转移概率矩阵B,创建MMSB模拟微博网络;S2、根据所述步骤S1中建立的MMSB微博模拟网络,已知混合隶属度<img file="FDA0000381714700000011.GIF" wi="37" he="45" />和转移概率矩阵B,由模型可得出整个微博网络中任意两个节点之间的微博转发百分比p(Y)的联合概率公式为:<maths num="0001"><![CDATA[<math><mrow><mi>p</mi><mrow><mo>(</mo><mi>Y</mi><mo>,</mo><msub><mover><mi>&pi;</mi><mo>&RightArrow;</mo></mover><mrow><mn>1</mn><mo>:</mo><mi>N</mi></mrow></msub><mo>,</mo><msub><mi>Z</mi><mo>&RightArrow;</mo></msub><mo>,</mo><msub><mi>Z</mi><mo>&LeftArrow;</mo></msub><mo>|</mo><mover><mi>&alpha;</mi><mo>&RightArrow;</mo></mover><mo>,</mo><mi>B</mi><mo>)</mo></mrow><mo>=</mo><munder><mi>&Pi;</mi><mrow><mi>p</mi><mo>,</mo><mi>q</mi></mrow></munder><mi>P</mi><mrow><mo>(</mo><mi>Y</mi><mrow><mo>(</mo><mi>p</mi><mo>,</mo><mi>q</mi><mo>)</mo></mrow><mo>|</mo><msub><mover><mi>z</mi><mo>&RightArrow;</mo></mover><mrow><mi>p</mi><mo>&RightArrow;</mo><mi>q</mi></mrow></msub><mo>,</mo><msub><mover><mi>z</mi><mo>&RightArrow;</mo></mover><mrow><mi>p</mi><mo>&LeftArrow;</mo><mi>q</mi></mrow></msub><mo>,</mo><mi>B</mi><mo>)</mo></mrow><mi>P</mi><mrow><mo>(</mo><msub><mover><mi>z</mi><mo>&RightArrow;</mo></mover><mrow><mi>p</mi><mo>&RightArrow;</mo><mi>q</mi></mrow></msub><mo>|</mo><msub><mover><mi>&pi;</mi><mo>&RightArrow;</mo></mover><mi>p</mi></msub><mo>)</mo></mrow><mi>P</mi><mrow><mo>(</mo><msub><mover><mi>z</mi><mo>&RightArrow;</mo></mover><mrow><mi>p</mi><mo>&LeftArrow;</mo><mi>q</mi></mrow></msub><mo>|</mo><msub><mover><mi>&pi;</mi><mo>&RightArrow;</mo></mover><mi>q</mi></msub><mo>)</mo></mrow><munder><mi>&Pi;</mi><mi>p</mi></munder><mi>P</mi><mrow><mo>(</mo><msub><mover><mi>&pi;</mi><mo>&RightArrow;</mo></mover><mi>p</mi></msub><mo>|</mo><mover><mi>&alpha;</mi><mo>&RightArrow;</mo></mover><mo>)</mo></mrow><mo>;</mo></mrow></math>]]></maths>其中<img file="FDA0000381714700000013.GIF" wi="164" he="67" />表示向量<img file="FDA0000381714700000014.GIF" wi="53" he="63" />的概率分布,由狄利克雷参数<img file="FDA0000381714700000015.GIF" wi="35" he="42" />来表示;<img file="FDA0000381714700000016.GIF" wi="232" he="80" />表示向量<img file="FDA0000381714700000017.GIF" wi="90" he="58" />的概率分布,由<img file="FDA0000381714700000018.GIF" wi="50" he="60" />表示;<img file="FDA0000381714700000019.GIF" wi="230" he="79" />表示向量<img file="FDA00003817147000000110.GIF" wi="91" he="59" />的概率分布,由<img file="FDA00003817147000000111.GIF" wi="46" he="60" />表示;<img file="FDA00003817147000000112.GIF" wi="485" he="79" />表示节点对(p,q)的微博转发百分比,且由<img file="FDA00003817147000000113.GIF" wi="259" he="58" />得来;所述N为微博网络中节点的个数;S3、根据步骤S2中得到了微博转发百分比p(Y)的表达式,采用平均场变量方法进行分析,对上述p(Y)的表达式的两边边缘概率取对数并用Jensen不等式得出式:<maths num="0002"><![CDATA[<math><mrow><mi>log</mi><mi>p</mi><mrow><mo>(</mo><mi>Y</mi><mo>|</mo><mi>&alpha;</mi><mo>,</mo><mi>B</mi><mo>)</mo></mrow><mo>&GreaterEqual;</mo><msub><mi>E</mi><mi>q</mi></msub><mo>[</mo><mi>log</mi><mi>p</mi><mrow><mo>(</mo><mi>Y</mi><mo>,</mo><msub><mover><mi>&pi;</mi><mo>&RightArrow;</mo></mover><mrow><mn>1</mn><mo>:</mo><mi>N</mi></mrow></msub><mo>,</mo><msub><mi>Z</mi><mo>&RightArrow;</mo></msub><mo>,</mo><msub><mi>Z</mi><mo>&LeftArrow;</mo></msub><mo>|</mo><mi>&alpha;</mi><mo>,</mo><mi>B</mi><mo>)</mo></mrow><mo>]</mo><mo>-</mo><msub><mi>E</mi><mi>q</mi></msub><mo>[</mo><mi>log</mi><mi>q</mi><mrow><mo>(</mo><msub><mover><mi>&pi;</mi><mo>&RightArrow;</mo></mover><mrow><mn>1</mn><mo>:</mo><mi>N</mi></mrow></msub><mo>,</mo><msub><mi>Z</mi><mo>&RightArrow;</mo></msub><mo>,</mo><msub><mi>Z</mi><mo>&LeftArrow;</mo></msub><mo>)</mo></mrow><mo>]</mo><mo>;</mo></mrow></math>]]></maths>S4、根据模拟微博网络实际测得的用户的微博转发百分比p(Y),以及所述步骤S3中得到的不等式,采用坐标上升算法求得微博网络实际的混合隶属度<img file="FDA00003817147000000130.GIF" wi="38" he="50" />和转移概率矩阵B。
地址 611731 四川省成都市高新区(西区)西源大道2006号