发明名称 一种基于先验知识的微博用户群体划分方法
摘要 本发明涉及一种基于先验知识的微博用户群体划分方法,该方法具体过程是:读取社交网络数据,构造以社交网络用户为节点、用户关系为边的社交网络图,构造用户相似度矩阵;初始化用户节点标签时,相似度高的节点赋相同标签,并采用标签传播算法来更新用户节点的标签;在标签传播的过程中,当被更新节点邻居节点中存在多个具有最高频率标签时随机选择一个最高频率标签更新该节点的标签,对于经过几步的迭代更新后,紧密连接的节点将会拥有相同的特定标签值。根据本发明实施例的社会网络群体划分方法,根据用户关系图边聚集系数属性,通过改进标签传播算法,对用户群体进行划分,划分结果对网络舆情监测、商业用户挖掘等都具有较好的应用价值。
申请公布号 CN105893382A 申请公布日期 2016.08.24
申请号 CN201410814368.1 申请日期 2014.12.23
申请人 天津科技大学 发明人 张贤坤;任静;牛四宝;刘申
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 代理人
主权项 一种基于先验知识的微博用户群体划分方法,其特征在于,所述方法包括以下步骤:步骤A:读取微博网络数据,构造以微博网络用户为节点、用户关系为边的社交网络图;步骤B:计算微博用户节点相似度矩阵;步骤C:节点标记:为每一个用户节点分配一个标签值,且对于每个节点,其邻居节点中相似度高于2的分配相同的标签,这些标签值作为用户节点所属社区的标识;步骤D:初步社区划分:对图中的所有顶点的标签进行迭代更新,每次迭代后,节点的标签值更新为其邻接节点的标签中数量最多的标签值;步骤E:社区划分细化:如果多个标签出现的频率最高时,在这些邻居节点标签中随机选择一个标签作为其标签;经过若干次迭代后,每个用户节点邻居中的标签变化趋于稳定;步骤F:将所有具有相同标签的节点归为一个社区。
地址 300222 天津市河西区大沽南路1038号