发明名称 一种互联网广告信息处理方法
摘要 一种互联网广告信息的分离、分析处理方法,该方法主要依赖各互联网媒体页面中对所有链接的URL地址进行分析,将链接到被监测媒体以外网站的链接进行分析归类,非常智能准确地分离出页面中的广告内容,帮助广告分拣人员快速对广告内容确认分析,大大降低人工分拣的工作量。
申请公布号 CN101383713A 申请公布日期 2009.03.11
申请号 CN200710045620.7 申请日期 2007.09.06
申请人 上海艾瑞市场咨询有限公司 发明人 杨伟庆
分类号 H04L12/18(2006.01)I;G06F17/30(2006.01)I 主分类号 H04L12/18(2006.01)I
代理机构 代理人
主权项 1. 一种互联网广告信息处理方法,其特征在于,包含如下步骤:页面内容抓取步骤,从互联网中的网站上下载被监测网站页面的内容,并自动由IE浏览器将该内容解释为用户显示界面,得到原始超文本标志语言页面;链接分离步骤,分离该原始超文本标志语言页面中的全部链接信息,记录IE浏览器中所有链接对象的链接,得到网页元素链接列表;域名分析步骤,分析该网页元素链接列表,将链接中不属于该网站的链接分离出来,得到非网站内链接列表;统一资源定位器聚类分析步骤,:对于该非网站内链接列表中的每一个链接,进行聚类分析,得到链接列表聚类分析表。
地址 201700上海市青浦区青松路128号