发明名称 提取网页内容的方法、装置及系统
摘要 本发明涉及一种提取网页内容的方法、装置及系统,其方法包括:响应移动客户端在浏览器上触发的网页浏览指令,获取对应的网页;解析网页,获取网页脚本中标签的DOM节点;从DOM节点中获取插件标签节点;当插件标签节点对应的插件标签为预定类型标签时,提取插件标签对应的插件资源。本发明可在网页尚未真正渲染时完成符合特定协议规范的内容的提取,由此提高了网页预定内容的提取速度,同时也提高了网页的展示速度,此外,由于本方案可以不依赖后台服务器而是在浏览器终端侧实现插件资源的提取,在技术上易于实现,可降低开发成本。
申请公布号 CN104866512A 申请公布日期 2015.08.26
申请号 CN201410067190.9 申请日期 2014.02.26
申请人 腾讯科技(深圳)有限公司 发明人 郭辛华;苏可;马宁;王璟瑶
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 深圳市世纪恒程知识产权代理事务所 44287 代理人 胡海国
主权项 一种提取网页内容的方法,其特征在于,包括:响应移动客户端在浏览器上触发的网页浏览指令,获取对应的网页;解析所述网页,获取网页脚本中标签的文档对象模型DOM节点;从所述DOM节点中获取插件标签节点;当所述插件标签节点对应的插件标签为预定类型标签时,提取所述插件标签对应的插件资源。
地址 518044 广东省深圳市福田区振兴路赛格科技园2栋东403室