发明名称 一种面向微博的特定倾向的高影响力用户群发现方法
摘要 本发明涉及社会化媒体数据分析与挖掘技术领域,提供了一种面向微博的特定倾向的高影响力用户群发现方法,该方法包括:S1、对微博网站上的数据进行抓取;S2、对获取的数据进行分析,找出每条微博所对应的不同主题;S3、建立新的微博网络拓扑结构;S4、分析用户的特定倾向与活跃程度,计算出用户间的传播概率;S5、根据得到的传播概率,找出面向特定主题的具有最大影响力的用户群。本发明综合考虑了微博的拓扑结构和微博的内容及主题,能反映真实情况。
申请公布号 CN103064917B 申请公布日期 2016.08.17
申请号 CN201210558984.6 申请日期 2012.12.20
申请人 中国科学院深圳先进技术研究院 发明人 刘斯尧;赵中英;冯圣中
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 深圳市科进知识产权代理事务所(普通合伙) 44316 代理人 宋鹰武
主权项 一种面向微博的特定倾向的高影响力用户群发现方法,其特征在于,包括:S1、对微博网站上的数据进行抓取,所述数据包括用户对微博的转发与评论数据;S2、对获取的数据进行分析,找出每条微博所对应的不同主题;基于LDA模型计算微博的主题,所述LDA模型不考虑语法问题,对于每一篇微博视为一个词频向量,将文本信息转换为数字信息;通过提取微博中的互异单词,并删除其中的停用词,推断出“微博—主题”的分布与“主题—单词”的分布;根据这两个分布,判断微博作者以及传播者所感兴趣的主题与各主题所占的比例,作为分析用户的特定倾向;取其比例最高的前三项主题作为微博内容的特定倾向;S3、建立新的微博网络拓扑结构,根据所获取的数据中的转发与评论的关系,重新建立网络;S4、分析用户的特定倾向与活跃程度,计算出用户间的传播概率;S5、根据得到的传播概率,找出面向特定主题的具有最大影响力的用户群。
地址 518055 广东省深圳市南山区西丽大学城学苑大道1068号