发明名称 网络话题内容演化分析装置及分析方法
摘要 本发明提供的是一种网络话题内容演化分析装置及分析方法。网络话题内容演化分析装置由网络事件数据收集装置、网络事件数据预处理装置、话题内容演化分析装置和输出装置构成。本发明的网络话题内容演化分析方法包括网络事件数据收集、网络事件预处理、相似度计算、话题多中心建立、话题中心更新和输出步骤。通过本发明可以发现与话题相关的多个内容侧面,采用多中心结构建立相应的话题模型,更为准确、全面地描述话题;通过话题多中心的建立和更新,可以展现话题内容的动态演化发展过程,即话题的产生、发展、高潮直至消亡的全过程。本发明提出的方法不依赖于报道的处理顺序,能够适用于侧重点不同的新闻报道的交叉出现情况。
申请公布号 CN101571853A 申请公布日期 2009.11.04
申请号 CN200910072084.9 申请日期 2009.05.22
申请人 哈尔滨工程大学 发明人 王巍;杨武;苘大鹏
分类号 G06F17/27(2006.01)I 主分类号 G06F17/27(2006.01)I
代理机构 代理人
主权项 1、一种网络话题内容演化分析装置,其构成包括依次连接的网络事件数据收集装置、网络事件数据预处理装置、话题内容演化分析装置和输出装置;其特征是:网络事件数据收集装置实时、主动地从互联网获取描述网络话题相关事件的原始数据,并进行存储;网络事件数据预处理装置对网络事件数据收集装置存储下来的网络事件描述原始数据,经过解析过滤掉其中的噪音,提取出真正与网络事件相关的核心数据,对核心数据进行特征定义和提取,表示为向量空间模型方式;经过数据预处理后输入话题演化分析装置,将与话题相关的事件进行聚类,并分析在话题内部事件的动态发展及演化过程;输出装置输出系统的话题演化分析结果。
地址 150001黑龙江省哈尔滨市南岗区南通大街145号1号楼哈尔滨工程大学科技处知识产权办公室