发明名称 |
舆情数据聚类方法和舆情数据聚类系统 |
摘要 |
本发明提出了一种舆情数据聚类方法和一种舆情数据聚类系统,其中,所述舆情数据聚类方法包括:对社交网络中的当前数据进行冗余过滤,以获取非冗余数据;对所述非冗余数据进行分析,以在所述非冗余数据中确定相关舆情数据;对所述相关舆情数据进行聚类,以在所述相关舆情数据中确定目标舆情数据。通过本发明的技术方案,通过对社交网站中的海量数据进行增量式的聚类,不仅可以使聚类的处理速度可以达到实时性的要求,还可以调整聚类结果,从而避免了聚类出局部片断式的聚类结果,进而提高了聚类结果的准确性。 |
申请公布号 |
CN106156192A |
申请公布日期 |
2016.11.23 |
申请号 |
CN201510191694.6 |
申请日期 |
2015.04.21 |
申请人 |
北大方正集团有限公司;北京大学;北京北大方正电子有限公司 |
发明人 |
郑妍;于晓明;杨建武 |
分类号 |
G06F17/30(2006.01)I;G06F17/27(2006.01)I;G06Q50/00(2012.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京友联知识产权代理事务所(普通合伙) 11343 |
代理人 |
尚志峰;汪海屏 |
主权项 |
一种舆情数据聚类方法,其特征在于,包括:对社交网络中的当前数据进行冗余过滤,以获取非冗余数据;对所述非冗余数据进行分析,以在所述非冗余数据中确定相关舆情数据;对所述相关舆情数据进行聚类,以在所述相关舆情数据中确定目标舆情数据。 |
地址 |
100871 北京市海淀区成府路298号方正大厦9层 |