发明名称 |
一种多租户网络舆情监控方法及系统 |
摘要 |
本发明公开了一种多租户网络舆情监控方法及系统,属于网络舆情信息监控技术领域。本发明首先采集网页数据,提取并存储所述网页数据中的元数据和正文,并将存储后的所述元数据和所述正文相关联;然后检索所述元数据和正文;最后分析所述正文是否符合预先设置的租户舆情监控规则和特征词库,如果符合,则将该正文分配给该租户。本发明统一实现了对数据的采集和存储,建立分布式全文检索系统支持海量数据的检索,灵活建立不同的租户,租户建立各自的业务规则,各租户之间业务规则不可见,根据配置的规则分析各租户所关心的舆情信息并进行有规则的存储,每个租户都可以高效快速的进行网络舆情监控。 |
申请公布号 |
CN103139256B |
申请公布日期 |
2016.05.04 |
申请号 |
CN201110390588.2 |
申请日期 |
2011.11.30 |
申请人 |
北大方正集团有限公司;北京大学;北京北大方正电子有限公司 |
发明人 |
张丹;杨建武;梁汝峰;孙红娥;王松 |
分类号 |
H04L29/08(2006.01)I;G06F17/30(2006.01)I |
主分类号 |
H04L29/08(2006.01)I |
代理机构 |
北京天悦专利代理事务所(普通合伙) 11311 |
代理人 |
田明;任晓航 |
主权项 |
一种多租户网络舆情监控方法,其特征在于,包括以下步骤:(1)采集网页数据,提取并存储所述网页数据中的元数据和正文,并将存储后的所述元数据和所述正文相关联;所述采集网页数据的方法如下:①确定需要采集的网站列表,生成采集任务;②检测各采集服务器的使用情况,分析各采集服务器的压力,将采集任务分发给压力最小的采集服务器;③采集服务器采集网页数据;(2)检索所述元数据和正文;(3)为不同租户建立不同账号,根据不同租户的租户ID为租户建立不同的用于存储租户舆情监控业务规则和租户所关心的舆情信息数据表,各租户之间的舆情监控业务规则不可见,分析所述正文是否符合预先设置的租户舆情监控规则和特征词库,如果符合,则将该正文分配给该租户,将符合租户舆情监控规则和特征词库的正文存储在该租户的舆情信息数据表中。 |
地址 |
100871 北京市海淀区成府路298号方正大厦 |