发明名称 从网页中提取图片的方法、装置及客户端设备
摘要 本发明提供一种从网页中提取图片的方法、装置及客户端设备,属于互联网应用技术领域。其中,从网页中提取图片的方法,包括:步骤a:获取所述网页的源代码,根据所述源代码获取所述网页的实质内容;步骤c:确定所述实质内容中的段落的重要程度,确定包含有图片的所述段落中重要程度最高的段落,并将所述重要程度最高的段落中的图片确定为待提取的目标图片;步骤d:获取所述目标图片,以将所述目标图片展示给用户,使得所述用户能够在未打开所述网页时通过查看所述目标图片了解所述网页的内容。本发明的技术方案可以从网页中提取与网页内容具有较高相关度的图片。
申请公布号 CN104281629A 申请公布日期 2015.01.14
申请号 CN201310294425.3 申请日期 2013.07.12
申请人 贝壳网际(北京)安全技术有限公司;北京金山网络科技有限公司;北京金山安全软件有限公司;珠海市君天电子科技有限公司;可牛网络技术(北京)有限公司 发明人 张凯宏;徐鸣
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京银龙知识产权代理有限公司 11243 代理人 许静;黄灿
主权项 一种从网页中提取图片的方法,其特征在于,包括:步骤a:获取所述网页的源代码,根据所述源代码获取所述网页的实质内容;步骤c:确定所述实质内容中的段落的重要程度,确定包含有图片的所述段落中重要程度最高的段落,并将所述重要程度最高的段落中的图片确定为待提取的目标图片;步骤d:获取所述目标图片,以将所述目标图片展示给用户,使得所述用户能够在未打开所述网页时通过查看所述目标图片了解所述网页的内容。
地址 100041 北京市石景山区八大处高科技园区西井路3号3号楼1100A房间