发明名称 |
抓取页面信息的方法及装置 |
摘要 |
本发明公开了一种抓取页面信息的方法及装置,涉及互联网技术领域,为解决现有技术中无法从页面信息中获得SEM信息的问题而发明。本发明的方法包括:获取关键词,关键词用于查询获得搜索结果页;根据关键词生成搜索结果页的统一资源定位符URL;构造包含URL的网络浏览器对象,并将网络浏览器对象加载到浏览器容器对象中;在浏览器容器对象中获取对应网络浏览器对象的页面源代码,页面源代码为搜索结果页的源代码;解析页面源代码,获得搜索引擎营销SEM信息。本发明适合应用在获取搜索网站的SEM信息的过程中。 |
申请公布号 |
CN106503016A |
申请公布日期 |
2017.03.15 |
申请号 |
CN201510564861.7 |
申请日期 |
2015.09.07 |
申请人 |
北京国双科技有限公司 |
发明人 |
郑国良;何熠皓 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京鼎佳达知识产权代理事务所(普通合伙) 11348 |
代理人 |
王伟锋;刘铁生 |
主权项 |
一种抓取页面信息的方法,其特征在于,所述方法包括:获取关键词,所述关键词用于查询获得搜索结果页;根据所述关键词生成所述搜索结果页的统一资源定位符URL;构造包含所述URL的网络浏览器对象,并将所述网络浏览器对象加载到浏览器容器对象中;在所述浏览器容器对象中获取对应所述网络浏览器对象的页面源代码,所述页面源代码为所述搜索结果页的源代码;解析所述页面源代码,获得搜索引擎营销SEM信息。 |
地址 |
100086 北京市海淀区双榆树小区知春路76号翠宫饭店8层A间 |