发明名称 用于识别网页中的广告的方法和系统
摘要 本发明涉及网页识别技术,尤其涉及识别网页中的广告的技术。本发明提供了一种用于识别网页中的广告的方法,包括:接收种子网页;通过分析所述种子网页的源代码得到所述种子网页的节点特征;根据预设的规则以及所述节点特征,确定所述种子网页中的种子广告;通过分析所述种子广告的链接得到所述种子广告的链接模式;以及利用所述链接模式,识别所述种子网页所在的网站中除了所述种子广告外的其它广告。
申请公布号 CN102033881A 申请公布日期 2011.04.27
申请号 CN200910177336.4 申请日期 2009.09.30
申请人 国际商业机器公司 发明人 包胜华;张小洵;张俐;苏中
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京市柳沈律师事务所 11105 代理人 邸万奎
主权项 一种用于识别网页中的广告的方法,包括:接收种子网页;通过分析所述种子网页的源代码得到所述种子网页的节点特征;根据预设的规则以及所述节点特征,确定所述种子网页中的种子广告;通过分析所述种子广告的链接得到所述种子广告的链接模式;利用所述链接模式,识别所述种子网页所在的网站中除了所述种子广告外的其它广告。
地址 美国纽约阿芒克