发明名称 一种用户账号的识别方法及设备
摘要 本申请公开了一种用户账号的识别方法及设备,通过采集各用户账号所对应的识别信息,所述识别信息中包含设定的关键字段和模型字段,当任意两个用户账号的识别信息中包含有至少一个相同的关键字段内容时,则确定该两个用户账号为同一用户所注册,否则,需要判断该两个用户账号的识别信息中模型字段的内容相似度,并根据所述模型字段的内容相似度评级来判断该两个用户账号是否为同一用户所注册,从而解决了无法有效地从大量的用户账号中识别出同一用户注册的用户账号的问题。
申请公布号 CN103118043B 申请公布日期 2015.12.02
申请号 CN201110363026.9 申请日期 2011.11.16
申请人 阿里巴巴集团控股有限公司 发明人 张立柱;张正威;杨廷辉
分类号 H04L29/08(2006.01)I;G06F17/30(2006.01)I 主分类号 H04L29/08(2006.01)I
代理机构 北京同达信恒知识产权代理有限公司 11291 代理人 郭润湘
主权项 一种用户账号的识别方法,其特征在于,包括以下步骤:服务器采集用户账号的识别信息,所述识别信息中包含设定的关键字段和模型字段;针对任意两个用户账号的识别信息,所述服务器判断所述两个用户账号的识别信息中是否有至少一个关键字段的内容相同;若是,则确定该两个用户账号是由同一用户注册的;否则,所述服务器确定识别信息中的模型字段的内容相似度,判断所述两个用户账号的识别信息中的模型字段的内容相似度是否达到设定条件,若是,则确定该两个用户账号是由同一用户注册的,否则,确定该两个用户账号是由不同用户注册的;所述确定识别信息中的模型字段的内容相似度包括:确定各模型字段的权重值;具体地,采用层次分析模型的方式,通过建立层次结构模型、构造成对比较阵、计算权向量并做一致性检验的步骤来得到各模型字段的权重值;分别将两个用户账号的识别信息中名称相同的模型字段的内容进行相似度运算,并将各运算结果与对应的模型字段的权重值进行加权求和,得到模型字段的内容相似度;其中,所述识别信息包括以下至少一种信息:用户账号注册时的注册信息、从第三方获取的信息和用户账号运行时产生的信息;以及,针对同一用户账号的相同名称的字段出现不同内容的情况,确定不同内容所属来源的权重,保留权重较高的来源提供的内容,或者,将不同来源的针对同一字段不同的内容,都作为该字段的内容保留。
地址 英属开曼群岛大开曼岛资本大厦一座四层847号邮箱