发明名称 一种获取用户网上浏览行为差异模式的系统和方法
摘要 本发明提供了一种获取用户网上浏览行为差异模式的方法,包括:A.输入日志数据库;B.按照预定的标准划分用户群体;C.为每个群体创建会话级的数据库(D1,D2,D3);D.分别从数据库(D1,D2,D3)中发现被频繁访问的单个项;E.分别为数据库(D1,D2,D3)创建前缀树(T1,T2,T3),其中数据库(D1,D2,D3)中的每一行对应前缀树(T1,T2,T3)中的一个分支,且不同的分支共享从根节点开始的路径;F.根据前缀树(T1,T2,T3)的头表(H1,H2,H3),构造当前项集同步处理前缀树(T1,T2,T3)中的项集;G.计算用户群体的项集在前缀树中支持度之间的差异度,把符合预定条件的阈值的项集放入差异模式集中;对符合剪裁条件的项集进行剪裁;H.对差异模式集中的项集按差异度降序排列并输出。
申请公布号 CN101894122A 申请公布日期 2010.11.24
申请号 CN201010169414.9 申请日期 2010.05.11
申请人 清华大学 发明人 刘红岩;郑勇;杨颖慧
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京金恒联合知识产权代理事务所 11324 代理人 李强
主权项 一种获取用户网上浏览行为差异模式的方法,其特征在于包括:A.输入日志数据库;B.按照一个预定的标准划分用户群体,C.为每个群体创建会话级的数据库(D1,D2,D3);D.分别从所述数据库(D1,D2,D3)中发现被频繁访问的单个项;E.分别为所述数据库(D1,D2,D3)创建前缀树(T1,T2,T3),其中所述数据库(D1,D2,D3)中的每一行对应所述前缀树(T1,T2,T3)中的一个分支,且不同的分支共享从根节点开始的路径;F.根据所述前缀树(T1,T2,T3)的头表(H1,H2,H3),构造当前项集,同步处理所述前缀树(T1,T2,T3)中的所述项集;G.计算所述用户群体的所述项集在所述前缀树中支持度之间的差异度,把符合预定条件的阈值的项集放入差异模式集中;对符合剪裁条件的项集进行剪裁;H.对差异模式集中的项集按差异度降序排列并输出。
地址 100084 北京市海淀区清华大学100084信箱82分箱