发明名称 | 一种跨平台微博社区账户匹配方法 | ||
摘要 | 本发明是涉及微博社区数据挖掘领域,是一种跨平台账户匹配方法,使多个社交平台账户建立联系成为可能。在本发明中,以新浪微博和腾讯微博作为账户匹配的两个社交平台,通过已知少量的匹配账户,从账户关注关系强度来挖掘疑似匹配账户;然后根据发布微博内容设定标签,并对其进行余弦相似度检验来进一步判定疑似匹配账户是否一致;最后将新确认的匹配账户加入已知匹配账户中;继续使用上述方法不断迭代,实现跨平台账户匹配。本发明可以为以后跨平台相关研究提供桥梁作用,亦可帮助舆情监督部门迅速识别相关账户,跟踪调研,进行科学决策提供信息支持。 | ||
申请公布号 | CN104765729A | 申请公布日期 | 2015.07.08 |
申请号 | CN201410000302.9 | 申请日期 | 2014.01.02 |
申请人 | 中国人民大学 | 发明人 | 李晓菲;梁循;周小平;施晓菁;申华;张海燕 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 代理人 | ||
主权项 | 一种跨平台微博社区账户匹配方法,其特征在于,该方法包括:第一阶段:数据预处理,结构化微博社区数据并对已知匹配账户进行标记;第二阶段:循环迭代匹配账户,通过已知的账户匹配对,利用关系矩阵寻找高关系融合度的疑似账户匹配对,再通过账户发布的微博内容的相似度在疑似账户匹配对集合中挑选出匹配账户,加入到账户匹配对集合中。 | ||
地址 | 100872 北京市海淀区中关村大街59号 |