发明名称 |
一种互联网广告信息处理方法 |
摘要 |
一种互联网广告信息的分离、分析处理方法,该方法主要依赖各互联网媒体页面中对所有链接的URL地址进行分析,将链接到被监测媒体以外网站的链接进行分析归类,非常智能准确地分离出页面中的广告内容,帮助广告分拣人员快速对广告内容确认分析,大大降低人工分拣的工作量。 |
申请公布号 |
CN101383713A |
申请公布日期 |
2009.03.11 |
申请号 |
CN200710045620.7 |
申请日期 |
2007.09.06 |
申请人 |
上海艾瑞市场咨询有限公司 |
发明人 |
杨伟庆 |
分类号 |
H04L12/18(2006.01)I;G06F17/30(2006.01)I |
主分类号 |
H04L12/18(2006.01)I |
代理机构 |
|
代理人 |
|
主权项 |
1. 一种互联网广告信息处理方法,其特征在于,包含如下步骤:页面内容抓取步骤,从互联网中的网站上下载被监测网站页面的内容,并自动由IE浏览器将该内容解释为用户显示界面,得到原始超文本标志语言页面;链接分离步骤,分离该原始超文本标志语言页面中的全部链接信息,记录IE浏览器中所有链接对象的链接,得到网页元素链接列表;域名分析步骤,分析该网页元素链接列表,将链接中不属于该网站的链接分离出来,得到非网站内链接列表;统一资源定位器聚类分析步骤,:对于该非网站内链接列表中的每一个链接,进行聚类分析,得到链接列表聚类分析表。 |
地址 |
201700上海市青浦区青松路128号 |