发明名称 |
一种网络爬虫模板的行为式生成方法 |
摘要 |
本发明公开了一种网络爬虫模板的行为式生成方法,以操作者访问网络服务为入口,选取一个或多个网络服务作为训练库,通过采集操作者对网络服务操作的行为集合和网络服务交互数据,并分析其行为特征与网络服务结构特征的关联性,进而快速构建网络爬虫的模板。较之于传统手段,该方法不仅能快速生成通用模板,而且可进一步提升采用该通用模板的网络数据爬虫的整体效率、覆盖度和准确度。 |
申请公布号 |
CN104298783A |
申请公布日期 |
2015.01.21 |
申请号 |
CN201410627310.6 |
申请日期 |
2014.11.10 |
申请人 |
武汉安问科技发展有限责任公司 |
发明人 |
温杰;李牧;舒文静;高谞 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
|
代理人 |
|
主权项 |
一种网络爬虫模板的行为式生成方法,其特征在于,包括以下步骤:1)操作者访问网络服务;2)选取一个或多个网络服务作为训练库,进行数据采集;3)对采集的数据进行特征关联;4)构建网络爬虫的通用模板。 |
地址 |
430074 湖北省武汉市关山大道曙光村光谷创意产业基地B栋201室 |