发明名称 在线内容采集
摘要 一种在线内容采集系统,包括:扫描服务器,用于扫描网站以获取潜在创意统一资源定位符(URL)。扫描和获取包括解析用于网站的网页,从解析的网页中标识与用于获取潜在创意URL的预定标准匹配的潜在创意URL,以及获取与预定标准匹配的潜在创意URL。数据储存器可以用来储存创意URL。在线内容采集服务器通过如下方式分析获取的潜在创意URL:通过将获取的潜在创意URL与在数据储存器中储存的创意URL进行比较来确定获取的潜在创意URL以前是否已经见过,以及如果获取的潜在创意URL以前已经见过,则确定获取的潜在创意URL是否指向创意。
申请公布号 CN103823825A 申请公布日期 2014.05.28
申请号 CN201310394779.5 申请日期 2013.08.30
申请人 埃森哲环球服务有限公司 发明人 M·菲格;J·霍尔曼
分类号 G06F17/30(2006.01)I;G06Q30/02(2012.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京市金杜律师事务所 11256 代理人 酆迅
主权项 一种在线内容采集系统,包括:扫描服务器,用于扫描网站以获取潜在创意统一资源定位符(URL),其中所述扫描和所述获取包括:解析用于所述网站的网页,从所解析的网页中标识与用于获取潜在创意URL的预定标准匹配的潜在创意URL,以及获取与所述预定标准匹配的所述潜在创意URL;数据储存器,用于储存创意URL;以及在线内容采集服务器,用于分析所获取的潜在创意URL,其中所述分析包括:通过将所获取的潜在创意URL与在所述数据储存器中储存的所述创意URL进行比较来确定所获取的潜在创意URL以前是否已经见过,以及如果所获取的潜在创意URL以前已经见过,则确定所获取的潜在创意URL是否指向创意。
地址 爱尔兰都柏林