发明名称 网页正文中图片的提取方法及装置
摘要 本发明公开了一种网页正文中图片的提取方法及装置,属于计算机技术领域。所述方法包括:获取网页正文中的图片节点,并获取所述图片节点的文字描述信息;根据所述图片节点的文字描述信息在获取的图片节点中提取与所述网页正文相关程度最大的图片。本发明还公开了一种网页正文中图片的提取装置,所述装置包括:第一获取模块和第一提取模块。本发明提高了提取的图片与网页正文的相关度,从而使得所提取的图片所代表的网页信息主题更明确,极大地提升了用户的体验。
申请公布号 CN103425644A 申请公布日期 2013.12.04
申请号 CN201210148409.9 申请日期 2012.05.14
申请人 腾讯科技(深圳)有限公司 发明人 蔡兵;张凯;徐羽
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京三高永信知识产权代理有限责任公司 11138 代理人 张耀光
主权项 一种网页正文中图片的提取方法,其特征在于,所述方法包括:获取网页正文中的图片节点,并获取所述图片节点的文字描述信息;根据所述图片节点的文字描述信息在获取的图片节点中提取与所述网页正文相关程度最大的图片。
地址 518000 广东省深圳市福田区赛格科技园2栋东403室