发明名称 一种网络爬虫模板的行为式生成方法
摘要 本发明公开了一种网络爬虫模板的行为式生成方法,以操作者访问网络服务为入口,选取一个或多个网络服务作为训练库,通过采集操作者对网络服务操作的行为集合和网络服务交互数据,并分析其行为特征与网络服务结构特征的关联性,进而快速构建网络爬虫的模板。较之于传统手段,该方法不仅能快速生成通用模板,而且可进一步提升采用该通用模板的网络数据爬虫的整体效率、覆盖度和准确度。
申请公布号 CN104298783A 申请公布日期 2015.01.21
申请号 CN201410627310.6 申请日期 2014.11.10
申请人 武汉安问科技发展有限责任公司 发明人 温杰;李牧;舒文静;高谞
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 代理人
主权项 一种网络爬虫模板的行为式生成方法,其特征在于,包括以下步骤:1)操作者访问网络服务;2)选取一个或多个网络服务作为训练库,进行数据采集;3)对采集的数据进行特征关联;4)构建网络爬虫的通用模板。
地址 430074 湖北省武汉市关山大道曙光村光谷创意产业基地B栋201室