发明名称 |
基于主动推技术的互联网信息采集方法和装置 |
摘要 |
本发明实施例提供了一种基于主动推技术的互联网信息采集方法和装置,其中该方法包括数据采集方和数据被采集方协商数据采集协议;所述数据被采集方按照所述数据采集协议把所述数据被采集方的特定数据主动推送到所述数据采集方;所述数据采集方接收所述特定数据,并且将所述特定数据进行存储;其中所述数据采集协议是指所述数据采集方和数据被采集方协商制定的数据提交规则,所述数据采集方是指采集网络信息数据的一方,所述数据被采集方是指提供网络信息数据的一方,所述特定数据是指在两次采集间隔内在数据被采集方上更新过的数据。本发明实施例所提供的方法和装置可以实现网络信息采集的及时性和全面性,能为搜索引擎、网络信息分析应用提供新型的采集技术。 |
申请公布号 |
CN102521379A |
申请公布日期 |
2012.06.27 |
申请号 |
CN201110428751.X |
申请日期 |
2011.12.19 |
申请人 |
上海交通大学 |
发明人 |
刘功申;胡佩华;许阳;王士林;李建华;李生红 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
上海思微知识产权代理事务所(普通合伙) 31237 |
代理人 |
郑玮 |
主权项 |
一种基于主动推技术的互联网信息采集方法方法,其特征在于,包括:数据采集方和数据被采集方协商数据采集协议;所述数据被采集方按照所述数据采集协议把所述数据被采集方的特定数据主动推送到所述数据采集方;所述数据采集方接收所述特定数据,并且将所述特定数据进行存储;其中所述数据采集协议是指所述数据采集方和数据被采集方协商制定的数据提交规则,所述数据采集方是指采集网络信息数据的一方,所述数据被采集方是指提供网络信息数据的一方,所述特定数据是指在两次采集间隔内在数据被采集方上更新过的数据。 |
地址 |
200240 上海市闵行区东川路800号 |