发明名称 一种引入列维飞行的社交网络专家定位方法
摘要 本发明提供一种引入列维飞行的社交网络专家定位方法,包括步骤:a.根据社交网络中用户与用户、用户与博文和博文与博文之间的相互关系构建用户博文行为关系图;b.根据用户的社交网络关系获得该用户的社交网络中心性值;c.根据微博博文在指定天数内的被转发量来获得博文的热度趋势值;d.在用户博文行为关系图的基础上,引入列维飞行因子的同时结合用户社交网络中心性和博文热度趋势值进行用户和博文的专业性权值迭代计算过程,直到稳定。本发明是根据社交网络中用户与博文之间的相互行为关系来进行专家用户的定位方法,其有的优点包括:更准确把握用户与用户、用户与博文、博文与博文之间的相互关系,更有效地衡量微博博文的内容质量,更准确地评价用户在社交网络中的专业性权重,更高效便捷。
申请公布号 CN103309957B 申请公布日期 2016.12.28
申请号 CN201310202741.3 申请日期 2013.05.28
申请人 华东师范大学 发明人 贺樑;吴奔斌;徐晓枫;罗念;陈昊;李明耀
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 上海蓝迪专利商标事务所(普通合伙) 31215 代理人 徐筱梅;张翔
主权项 一种引入列维飞行的社交网络专家定位方法,其特征在于,包括如下步骤:a)确定社交网络中用户与用户、用户与博文及博文与博文之间的相互关系;b)基于用户之间的社交网络关系,计算微博用户的社交网络中心性值;c)基于转发博文与原创博文之间的关系,计算博文热度趋势值;具体包括:I)根据指定时间D天内的原创博文转发关系,计算该原创博文在第t天的被转发次数|V<sub>i,t</sub>|;II)根据D天内的原创博文转发关系,计算该指定时间内的该原创博文的每天被转发次数的期望值μ<sub>i,t</sub>和方差值σ<sub>i,t</sub>;III)根据以下公式计算第i篇博文热度趋势值Trend(i),其中N为博文总数;<maths num="0001"><math><![CDATA[<mrow><mi>T</mi><mi>r</mi><mi>e</mi><mi>n</mi><mi>d</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><munderover><mo>&Sigma;</mo><mrow><mi>t</mi><mo>=</mo><mn>1</mn></mrow><mi>D</mi></munderover><mrow><mo>(</mo><mo>(</mo><mrow><mo>|</mo><msub><mi>V</mi><mrow><mi>i</mi><mo>,</mo><mi>t</mi></mrow></msub><mo>|</mo><mo>-</mo><msub><mi>&mu;</mi><mrow><mi>i</mi><mo>,</mo><mi>t</mi></mrow></msub></mrow><mo>)</mo><mo>/</mo><msub><mi>&sigma;</mi><mrow><mi>i</mi><mo>,</mo><mi>t</mi></mrow></msub><mo>)</mo></mrow></mrow><mi>D</mi></mfrac><mo>,</mo><mn>0</mn><mo>&lt;</mo><mi>i</mi><mo>&le;</mo><mi>N</mi><mo>,</mo><mn>0</mn><mo>&lt;</mo><mi>t</mi><mo>&le;</mo><mi>D</mi><mo>;</mo></mrow>]]></math><img file="FDA0000975458850000011.GIF" wi="1062" he="187" /></maths>d)对社交网络中的用户确定其所拥有的专业性权值;最大的前10%的用户作为专家;其中:具体包括:I)确定用户博文行为关系图中的边权值a<sub>ij</sub>;II)根据用户博文行为关系图来生成用户与博文之间的邻接矩阵A;初始化用户结点的专家性权值为该用户的社交网络中心性值;III)确定用户和博文的最终专业性权值,并根据用户的专业性权值从大到小进行排序,并同时取其中前10%的用户作为专家;具体包括:ⅰ)根据如下公式分别计算用户和博文在第k次迭代中的专业性权值<img file="FDA0000975458850000012.GIF" wi="67" he="71" />其中d是列维飞行模式跳转概率;<maths num="0002"><math><![CDATA[<mrow><msubsup><mi>r</mi><mi>j</mi><mi>k</mi></msubsup><mo>=</mo><mi>d</mi><mo>*</mo><msubsup><mi>Ar</mi><mi>j</mi><mrow><mi>k</mi><mo>-</mo><mn>1</mn></mrow></msubsup><mo>+</mo><mrow><mo>(</mo><mn>1</mn><mo>-</mo><mi>d</mi><mo>)</mo></mrow><mo>/</mo><mo>|</mo><mi>V</mi><mo>|</mo></mrow>]]></math><img file="FDA0000975458850000013.GIF" wi="530" he="76" /></maths>式中:|V|是图中用户结点与博文结点的总数;ii)根据该博文的博文热度趋势值Trend(i)调整博文的专业性权值<img file="FDA0000975458850000014.GIF" wi="67" he="71" />iii)对用户和博文的专业性权值<img file="FDA0000975458850000015.GIF" wi="43" he="71" />进行归一化计算。
地址 200241 上海市闵行区东川路500号