发明名称 用于重建网上内容的方法和数据处理系统
摘要 提供一种用于重建包括多个网页的Web内容的方法和数据处理系统。该方法包括生成包括网页历史记录的日志文件的步骤。网页历史记录包括已经由用户从多个网页选择的所有网页。利用网页历史记录为每个选择的网页确定访问频率。确定包括已经由用户用最大访问频率访问的网页的网页子集。该子集限于最大数目的网页。多个网页通常以树形结构安排。该树形结构源于起始网页。包括在网页子集中的网页链接到直接链接到起始网页的小门户、或同样直接链接到起始网页的在当用户访问用户特定的特殊网页时的时间点确定的网页子集。根据本发明的方法特别有利,因为它允许用户直接访问离起始网页几次点击远的网页。因而为到达他的喜好网页他不必点击通过许多网页。
申请公布号 CN101346720A 申请公布日期 2009.01.14
申请号 CN200680048958.1 申请日期 2006.11.29
申请人 国际商业机器公司 发明人 斯蒂芬·利希;安德烈亚斯·诺尔兹
分类号 G06F17/30(2006.01) 主分类号 G06F17/30(2006.01)
代理机构 北京市柳沈律师事务所 代理人 周少杰
主权项 1.一种重建Web内容(104)的方法,所述Web内容(104)包括多个网页(130、...、150),所述方法包括:生成日志文件(122),所述日志文件(122)包括各网页的历史记录(124),所述各网页的历史记录(124)包括由用户从所述多个网页(130、...、150)选择的所有网页(130、...、144);为由所述用户选择的每个网页(130、...、144)确定访问频率(156),所述访问频率(156)利用所述各网页的历史记录(124)确定;确定网页的子集(162),所述网页的子集(162)包含最大数目(158)的网页,所述最大数目(158)是预定的,所述网页的子集(162)包含具有最大访问频率(156)的网页。
地址 美国纽约