发明名称 一种社交网站账号相似度的综合数据挖掘方法
摘要 本发明公开了一种社交网站账号相似度的综合数据挖掘方法,该方法能够用于网络舆情监控中,解决识别同一用户的多个社交网站账号的问题。本发明综合考虑了影响社交网站账号综合相似度的三大类因素:个人属性、交互行为和内容,并利用训练样本确定各因素相似度在综合相似度计算中所占的权重。与现有技术相比,本发明的技术优势在于:(1)为识别同一用户的多个社交网站账号提供量化、可靠、全面的参考,并且适用于大数据环境下的计算机自动处理;(2)采用训练样本确定各因素相似度在综合相似度计算中所占的权重,能够保持与人工处理结果的一致性。
申请公布号 CN104899267A 申请公布日期 2015.09.09
申请号 CN201510268991.6 申请日期 2015.05.22
申请人 中国电子科技集团公司第二十八研究所 发明人 徐琳;王犇;葛唯益;刘畅;徐欣
分类号 G06F17/30(2006.01)I;G06Q50/00(2012.01)I 主分类号 G06F17/30(2006.01)I
代理机构 江苏圣典律师事务所 32237 代理人 胡建华
主权项 一种社交网站账号相似度的综合数据挖掘方法,其特征在于,包括社交网站账号综合相似度的计算的方法,步骤如下:步骤1,计算两个不同社交网站账号的个人属性因素的相似度;步骤2,计算两个不同社交网站账号交互行为的相似度;步骤3,计算两个不同社交网站账号的内容的相似度;步骤4,通过对步骤1~3中计算得到的相似度的加权平均,计算两个社交网站账号的综合相似度。
地址 210007 江苏省南京市苜蓿园东街1号1406信箱07分箱