发明名称 一种跨平台用户识别方法和系统
摘要 本发明公开的跨平台用户识别方法和系统,充分考虑社交平台中用户消息的重要性,通过相应时间段内不同平台的两个账户中用户消息所反映的用户见闻、兴趣、偏好以及写作风格、用词惯等个性化信息的相似情况,来识别用户是否为同一用户,具体地,本发明方法获取不同平台的两个账户中发布时间在预设时间段内的消息内容,并对两个账户的消息内容进行分词及特征抽取处理,在此基础上,利用两个账户消息的分词特征相似度识别所述不同平台的两个账户是否属于同一用户。可见,本发明解决了不同社交平台同一用户的识别问题,进而为同一用户的跨平台数据分析提供了支持。
申请公布号 CN104317784A 申请公布日期 2015.01.28
申请号 CN201410521299.5 申请日期 2014.09.30
申请人 苏州大学 发明人 李寿山;黄磊;周国栋;王红玲
分类号 G06F17/27(2006.01)I 主分类号 G06F17/27(2006.01)I
代理机构 北京集佳知识产权代理有限公司 11227 代理人 常亮
主权项 一种跨平台用户识别方法,其特征在于,包括:获取第一平台上第一用户账户的第一消息段,获取第二平台上第二用户账户的第二消息段,其中,所述第一消息段为由所述第一用户账户内发布时间在第一预设时间段内的所有消息组成的消息段,所述第二消息段为由所述第二用户账户内发布时间在第一预设时间段内的所有消息组成的消息段;分别对所述第一消息段及所述第二消息段进行分词处理,得到分词形式的第一消息段及分词形式的第二消息段;基于预设的分词特征对所述分词形式的第一消息段及分词形式的第二消息段进行特征抽取,并在特征抽取的基础上获取所述第一消息段与所述第二消息段的特征相似度数值;判断所述特征相似度数值是否在预设的相似度数值参考范围内;若判断结果为是,则所述第一用户账户及所述第二用户账户属于同一用户。
地址 215137 江苏省苏州市相城区济学路8号