发明名称 基于态势评估的网络热点话题发现方法及系统
摘要 本发明公开了一种基于态势评估的网络热点话题发现方法及系统。其中,该方法包括:实时获取网络论坛数据;对所述网络论坛数据进行语料预处理,提取候选词串;基于所述候选词串,形成向量形式的特征集合以表示每条帖子;对所述帖子进行聚类,依据聚类结果获取发现的热点话题并进行量化;对聚类产生的热点话题进行态势评估,并依据态势评估结果,修正所述发现的热点话题。本发明综合利用话题发现与跟踪算法和态势评估思想,进行可选择与可定制处理过程的算法组织形式,对文本信息进行分析与数据挖掘,对热点话题发现。实验结果验证了本发明的有效性和准确性,具有很大的实用价值。
申请公布号 CN101980199A 申请公布日期 2011.02.23
申请号 CN201010529273.7 申请日期 2010.10.28
申请人 北京交通大学 发明人 刘云;司夏萌;张振江;沈波;程辉;程军军;熊菲
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京市商泰律师事务所 11255 代理人 毛燕生
主权项 一种基于态势评估的网络热点话题发现方法,其特征在于,包括如下步骤:数据获取步骤,实时获取网络论坛数据;候选词串提取步骤,对所述网络论坛数据进行语料预处理,提取候选词串;热点话题发现步骤,基于所述候选词串,形成向量形式的特征集合以表示每条帖子;对所述帖子进行聚类,依据聚类结果获取发现的热点话题并进行量化;态势评估步骤,对聚类产生的热点话题进行态势评估,并依据态势评估结果,修正所述发现的热点话题。
地址 100044 北京市海淀区西直门外上园村3号