发明名称 一种基于视觉特征提取的网页传感信息块判决方法
摘要 本发明的目的是提供一种基于视觉特征提取的网页传感信息块判决方法。首先对网页内容进行预处理,提取网页源代码的标签结构树和截图保存集合;根据预处理得到的两个集合,对网页内容进行有效分割,控制网页的分割粒度,使其最大限度匹配传感信息块的粒度大小;最后,对分割后的所有网页数据块进行视觉特征分析,提取特征向量,利用分类器实现网页传感信息块的判决。本发明可以实现网页传感信息块的自动判决,并根据判决结果进一步为网页传感信息量的有效评价提供解决方案。
申请公布号 CN106326451A 申请公布日期 2017.01.11
申请号 CN201610740600.0 申请日期 2016.08.26
申请人 武汉大学 发明人 李德识;刘鸣柳;陈健
分类号 G06F17/30(2006.01)I;G06K9/62(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 代理人 赵丽影
主权项 一种基于视觉特征提取的网页传感信息块判决方法,其特征在于:先对待判决的网页进行预处理;然后根据处理后提取的参数信息实现网页分割;接着对分割后得到的网页数据块依次提取特征并进行最后判决;具体包括以下步骤:步骤1:网页预处理,提取待检测标签集合以及预定时间点网页截图集合;步骤2:自适应传感粒度的网页分割;步骤3:分割后网页数据块的视觉特征提取;步骤4:依据特征提取的结果,利用分类器对网页数据块进行判决,实现对传感信息块的判断以及信息块类型的判断。
地址 430072 湖北省武汉市武昌区珞珈山武汉大学