发明名称 |
一种社交网站账号相似度的综合数据挖掘方法 |
摘要 |
本发明公开了一种社交网站账号相似度的综合数据挖掘方法,该方法能够用于网络舆情监控中,解决识别同一用户的多个社交网站账号的问题。本发明综合考虑了影响社交网站账号综合相似度的三大类因素:个人属性、交互行为和内容,并利用训练样本确定各因素相似度在综合相似度计算中所占的权重。与现有技术相比,本发明的技术优势在于:(1)为识别同一用户的多个社交网站账号提供量化、可靠、全面的参考,并且适用于大数据环境下的计算机自动处理;(2)采用训练样本确定各因素相似度在综合相似度计算中所占的权重,能够保持与人工处理结果的一致性。 |
申请公布号 |
CN104899267A |
申请公布日期 |
2015.09.09 |
申请号 |
CN201510268991.6 |
申请日期 |
2015.05.22 |
申请人 |
中国电子科技集团公司第二十八研究所 |
发明人 |
徐琳;王犇;葛唯益;刘畅;徐欣 |
分类号 |
G06F17/30(2006.01)I;G06Q50/00(2012.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
江苏圣典律师事务所 32237 |
代理人 |
胡建华 |
主权项 |
一种社交网站账号相似度的综合数据挖掘方法,其特征在于,包括社交网站账号综合相似度的计算的方法,步骤如下:步骤1,计算两个不同社交网站账号的个人属性因素的相似度;步骤2,计算两个不同社交网站账号交互行为的相似度;步骤3,计算两个不同社交网站账号的内容的相似度;步骤4,通过对步骤1~3中计算得到的相似度的加权平均,计算两个社交网站账号的综合相似度。 |
地址 |
210007 江苏省南京市苜蓿园东街1号1406信箱07分箱 |