发明名称 一种对多个用户进行用户群划分的方法、装置与设备
摘要 本发明的目的是提供一种用于基于用户拓扑关系网对多个用户进行用户群划分的方法、装置与设备。其中,本发明获取基于网民的同次检索的搜索结果中,多个用户中任意两个用户的发布信息的共同发布次数和非共同发布次数;根据该任意两个用户的所述共同发布次数及所述非共同发布次数,确定该任意两个用户的共现关系强度;当所述共现关系强度不小于预定的关系强度阈值时,通过层次级聚类方法对所述用户拓扑关系网中的多个用户进行用户群划分。
申请公布号 CN103049496B 申请公布日期 2016.08.17
申请号 CN201210526282.X 申请日期 2012.12.07
申请人 北京百度网讯科技有限公司 发明人 闫新发;黄启友;谢剑;董贯慧
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京汉昊知识产权代理事务所(普通合伙) 11370 代理人 罗朋
主权项 一种基于用户拓扑关系网对多个用户进行用户群划分的方法,该方法包括以下步骤:a获取基于网民的同次检索的搜索结果中,多个用户中任意两个用户的发布信息的共同发布次数和非共同发布次数,其中,所述任意两个用户的发布信息同时出现在网民的同次检索的搜索结果页面中为一次共同发布,所述共同发布次数指基于网民的同次检索的搜索结果中、所述任意两个用户的发布信息同时出现在搜索结果页面中的统计次数,所述非共同发布次数指基于网民的同次检索的搜索结果中、所述任意两个用户的发布信息未同时出现在搜索结果页面中的统计次数;b根据该任意两个用户的所述共同发布次数及所述非共同发布次数,确定该任意两个用户的共现关系强度;c当所述共现关系强度不小于预定的关系强度阈值时,通过层次级聚类方法对所述用户拓扑关系网中的多个用户进行用户群划分,其中包括:‑通过CNM算法,基于下式来构建初始化模块度增量矩阵ΔQ,其中,初始化将所述用户拓扑关系网中每个节点上的一个用户作为一个用户群:<img file="FDA0000983771130000011.GIF" wi="1622" he="141" />其中,ΔQ<sub>ij</sub>表示模块度增量矩阵中的每个元素值;m表示用户拓扑关系网中全部边的连接权值和;k<sub>i</sub>与k<sub>j</sub>分别表示用户i对应的节点所关联的所有边的连接权值和与用户j对应的节点所关联的所有边的连接权值和;‑基于所述模块度增量矩阵ΔQ,通过合并更新矩阵的聚类方式,对所述用户拓扑关系网的多个用户进行用户群划分;所述方法还包括:‑基于CNM算法,根据下式在所述用户拓扑关系网中确定每个用户群的用户群内交互关系强度:Q=∑<sub>i</sub>(e<sub>ii</sub>‑a<sub>i</sub><sup>2</sup>);其中,i表示用户拓扑关系网中划分后的用户群i;e<sub>ii</sub>表示用户群i中处于群内的边的连接权值和与用户拓扑关系网中所有边的连接权值和的比例;a<sub>i</sub>表示用户群i所关联的所有边的连接权值和与用户拓扑关系网中所有边的连接权值和的比例。
地址 100085 北京市海淀区上地十街10号百度大厦2层