发明名称 | 基于态势评估的网络热点话题发现方法及系统 | ||
摘要 | 本发明公开了一种基于态势评估的网络热点话题发现方法及系统。其中,该方法包括:实时获取网络论坛数据;对所述网络论坛数据进行语料预处理,提取候选词串;基于所述候选词串,形成向量形式的特征集合以表示每条帖子;对所述帖子进行聚类,依据聚类结果获取发现的热点话题并进行量化;对聚类产生的热点话题进行态势评估,并依据态势评估结果,修正所述发现的热点话题。本发明综合利用话题发现与跟踪算法和态势评估思想,进行可选择与可定制处理过程的算法组织形式,对文本信息进行分析与数据挖掘,对热点话题发现。实验结果验证了本发明的有效性和准确性,具有很大的实用价值。 | ||
申请公布号 | CN101980199A | 申请公布日期 | 2011.02.23 |
申请号 | CN201010529273.7 | 申请日期 | 2010.10.28 |
申请人 | 北京交通大学 | 发明人 | 刘云;司夏萌;张振江;沈波;程辉;程军军;熊菲 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 北京市商泰律师事务所 11255 | 代理人 | 毛燕生 |
主权项 | 一种基于态势评估的网络热点话题发现方法,其特征在于,包括如下步骤:数据获取步骤,实时获取网络论坛数据;候选词串提取步骤,对所述网络论坛数据进行语料预处理,提取候选词串;热点话题发现步骤,基于所述候选词串,形成向量形式的特征集合以表示每条帖子;对所述帖子进行聚类,依据聚类结果获取发现的热点话题并进行量化;态势评估步骤,对聚类产生的热点话题进行态势评估,并依据态势评估结果,修正所述发现的热点话题。 | ||
地址 | 100044 北京市海淀区西直门外上园村3号 |