发明名称 | 用于识别网页中的广告的方法和系统 | ||
摘要 | 本发明涉及网页识别技术,尤其涉及识别网页中的广告的技术。本发明提供了一种用于识别网页中的广告的方法,包括:接收种子网页;通过分析所述种子网页的源代码得到所述种子网页的节点特征;根据预设的规则以及所述节点特征,确定所述种子网页中的种子广告;通过分析所述种子广告的链接得到所述种子广告的链接模式;以及利用所述链接模式,识别所述种子网页所在的网站中除了所述种子广告外的其它广告。 | ||
申请公布号 | CN102033881A | 申请公布日期 | 2011.04.27 |
申请号 | CN200910177336.4 | 申请日期 | 2009.09.30 |
申请人 | 国际商业机器公司 | 发明人 | 包胜华;张小洵;张俐;苏中 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 北京市柳沈律师事务所 11105 | 代理人 | 邸万奎 |
主权项 | 一种用于识别网页中的广告的方法,包括:接收种子网页;通过分析所述种子网页的源代码得到所述种子网页的节点特征;根据预设的规则以及所述节点特征,确定所述种子网页中的种子广告;通过分析所述种子广告的链接得到所述种子广告的链接模式;利用所述链接模式,识别所述种子网页所在的网站中除了所述种子广告外的其它广告。 | ||
地址 | 美国纽约阿芒克 |