发明名称 一种网络用户分类方法及其装置
摘要 本发明公开了一种网络用户分类方法及其装置,该方法包括:基于用户的网络行为生成用户的行为特征向量;基于各用户的所述行为特征向量进行聚类,以构建用户-主题矩阵;以及基于所述用户-主题矩阵来确定用户所属的网页类别,其中,所述用户的网络行为包括网络访问行为和搜索行为;所述用户-主题矩阵的各元素值分别表征各用户与各主题之间的关联度。在本发明中,基于用户搜索行为和访问行为的多种类别数据,通过采用用户主题模型,在较小的计算代价上覆盖全面的用户行为,充分的利用了用户的信息,得到更快更精准的用户分类结果。
申请公布号 CN102521248B 申请公布日期 2015.01.07
申请号 CN201110359807.0 申请日期 2011.11.14
申请人 北京亿赞普网络技术有限公司 发明人 罗峰;黄苏支;李娜
分类号 G06F17/30(2006.01)I;G06Q30/02(2012.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京聿宏知识产权代理有限公司 11372 代理人 吴大建;钟日红
主权项 一种网络用户分类方法,其特征在于,包括:基于用户的网络行为生成用户的行为特征向量;基于各用户的所述行为特征向量进行聚类,以构建用户‑主题矩阵;构建主题‑类别变换矩阵;以及通过将所述用户‑主题矩阵与所述主题‑类别变换矩阵相乘,得到用户‑类别矩阵,以基于所述用户‑主题矩阵来确定用户所属的网页类别,其中,所述用户的网络行为包括网络访问行为和搜索行为;所述用户‑主题矩阵的各元素值分别表征各用户与各主题之间的关联度;以及,在前述通过将所述用户‑主题矩阵与所述主题‑类别变换矩阵相乘得到用户‑类别矩阵、以基于所述用户‑主题矩阵来确定用户所属的网页类别的步骤中,基于所述用户‑类别矩阵,将与用户关联度最大一个或多个网页类别确定为该用户所属的网页类别。
地址 100081 北京市海淀区中关村南大街甲18号院2号楼1607