发明名称 |
网站使用记录探勘装置及方法 |
摘要 |
一种网站使用记录探勘装置及方法以及计算机可读取储存媒体,其系统包括一储存装置,储存网络使用记录以及最小支持度记录,其中,网络使用记录包含具顺序性的连结对象,最小支持度记录储存连结对象的支持度数值。一处理单元,输入网络使用记录以及最小支持度记录,将出现次数大于支持度数值的连结对象加入到第一长关联顺序集合。选择出现次数大于零的连结对象为候选连结对象,产生包含两个候选连结对象的第一候选关联顺序,将出现次数大于所包含候选连结对象的最小支持度数值的第一候选关联顺序加入到第二长关联顺序集合。 |
申请公布号 |
CN100421105C |
申请公布日期 |
2008.09.24 |
申请号 |
CN200310123519.0 |
申请日期 |
2003.12.24 |
申请人 |
明基电通股份有限公司 |
发明人 |
李昌鸿 |
分类号 |
G06F17/30(2006.01);G06F17/00(2006.01) |
主分类号 |
G06F17/30(2006.01) |
代理机构 |
北京市柳沈律师事务所 |
代理人 |
吕晓章;马莹 |
主权项 |
1. 一种网站使用记录探勘方法,其方法被一计算机加载执行,包括下列步骤:输入一网络使用记录以及一最小支持度记录,其中,上述网络使用记录包含具顺序性的多个连结对象,上述最小支持度记录储存相应于上述连结对象的一支持度数值,上述连结对象的连结阶层越高则上述支持度数值越高;扫描上述网络使用记录,计算上述连结对象的出现次数,将出现次数大于上述支持度数值的上述连结对象加入到一第一长关联顺序集合;选择出现次数大于零的上述连结对象为多个候选连结对象,产生包含两个上述候选连结对象的多个第一候选关联顺序;扫描上述网络使用记录,计算上述第一候选关联顺序的出现次数,将出现次数大于所包含上述候选连结对象中的最小上述支持度数值的上述第一候选关联顺序加入到一第二长关联顺序集合;以及合并上述第一长关联顺序集合以及上述第二长关联顺序集合,产生上述经常关联顺序集合,其中,更包括下列步骤:选择上述第二长关联顺序集合中所包含的上述第一候选关联顺序,进行上述第一候选关联顺序的自身合并,产生包含三个上述候选连结对象的多个第二候选关联顺序;扫描上述网络使用记录,计算上述第二候选关联顺序的出现次数,将出现次数大于所包含上述候选连结对象中的最小上述支持度数值的上述第二候选关联顺序加入到一第三长关联顺序集合;以及合并上述第三长关联顺序集合到上述经常关联顺序集合,和其中,自身合并所采用的合并形式为序首合并、序中合并或序尾合并。 |
地址 |
台湾省桃园县 |