发明名称 |
一种基于社交软件的数据获取方法及装置 |
摘要 |
本发明提供一种基于社交软件的数据获取方法及装置,方法包括:S1:在目标社交软件中选择至少一个注册用户,并将该至少一个注册用户分别对应的用户标识添加到爬取队列中;S2:根据所述爬取队列中的用户标识,逐个爬取每一个用户标识所对应用户的网页数据和好友列表;S3:将爬取到的好友列表中每一个用户标识添加到所述爬取队列中,并返回执行步骤S2,直到满足设定条件时结束。根据本方案,可以爬取到的网页数据所对应用户的个数也越多,从而可以提高分析结果的准确率。 |
申请公布号 |
CN105243122A |
申请公布日期 |
2016.01.13 |
申请号 |
CN201510633010.3 |
申请日期 |
2015.09.29 |
申请人 |
浪潮电子信息产业股份有限公司 |
发明人 |
李鹏 |
分类号 |
G06F17/30(2006.01)I;G06Q50/00(2012.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
济南信达专利事务所有限公司 37100 |
代理人 |
李世喆 |
主权项 |
一种基于社交软件的数据获取方法,其特征在于,包括:S1:在目标社交软件中选择至少一个注册用户,并将该至少一个注册用户分别对应的用户标识添加到爬取队列中;S2:根据所述爬取队列中的用户标识,逐个爬取每一个用户标识所对应用户的网页数据和好友列表;S3:将爬取到的好友列表中每一个用户标识添加到所述爬取队列中,并返回执行步骤S2,直到满足设定条件时结束。 |
地址 |
250100 山东省济南市高新区浪潮路1036号 |