发明名称 一种网页相似度计算方法及装置
摘要 本发明实施例公开一种网页相似度计算方法及装置,应用于计算机网络领域,能够解决现有的比对两个网页的相似度时判断不准的问题。该方法包括:生成待测网页对应的基于视觉结构的第一分块特征向量,其中第一分块特征向量包括第一分块位置特征向量和第一分块内容特征向量;将第一分块特征向量和预设网页对应的基于视觉结构的第二分块特征向量进行比对,获得待测网页的相似度。本发明的实施例应用于比较网页相似度。
申请公布号 CN104133870A 申请公布日期 2014.11.05
申请号 CN201410348586.0 申请日期 2014.07.22
申请人 哈尔滨工业大学(威海) 发明人 魏玉良;吕芳;邹新一;王佰玲;黄俊恒;刘扬
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京科亿知识产权代理事务所(普通合伙) 11350 代理人 汤东凤
主权项 一种网页相似度计算方法,其特征在于,包括:生成待测网页对应的基于视觉结构的第一分块特征向量,其中所述第一分块特征向量包括第一分块位置特征向量和第一分块内容特征向量;将所述第一分块特征向量和预设网页对应的基于视觉结构的第二分块特征向量进行比对,获得待测网页的相似度。
地址 264209 山东省威海市文化西路2号