发明名称 舆情数据聚类方法和舆情数据聚类系统
摘要 本发明提出了一种舆情数据聚类方法和一种舆情数据聚类系统,其中,所述舆情数据聚类方法包括:对社交网络中的当前数据进行冗余过滤,以获取非冗余数据;对所述非冗余数据进行分析,以在所述非冗余数据中确定相关舆情数据;对所述相关舆情数据进行聚类,以在所述相关舆情数据中确定目标舆情数据。通过本发明的技术方案,通过对社交网站中的海量数据进行增量式的聚类,不仅可以使聚类的处理速度可以达到实时性的要求,还可以调整聚类结果,从而避免了聚类出局部片断式的聚类结果,进而提高了聚类结果的准确性。
申请公布号 CN106156192A 申请公布日期 2016.11.23
申请号 CN201510191694.6 申请日期 2015.04.21
申请人 北大方正集团有限公司;北京大学;北京北大方正电子有限公司 发明人 郑妍;于晓明;杨建武
分类号 G06F17/30(2006.01)I;G06F17/27(2006.01)I;G06Q50/00(2012.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京友联知识产权代理事务所(普通合伙) 11343 代理人 尚志峰;汪海屏
主权项 一种舆情数据聚类方法,其特征在于,包括:对社交网络中的当前数据进行冗余过滤,以获取非冗余数据;对所述非冗余数据进行分析,以在所述非冗余数据中确定相关舆情数据;对所述相关舆情数据进行聚类,以在所述相关舆情数据中确定目标舆情数据。
地址 100871 北京市海淀区成府路298号方正大厦9层