发明名称 一种互联网舆情信息监测系统及监测方法
摘要 本发明提供一种互联网舆情信息监测系统及监测方法,该系统包括采集模块、数据预处理模块、存储处理模块、服务监控模块与显示模块;所述采集模块的输出端与数据预处理模块的输入端通过有线连接,所述数据预处理模块与存储处理模块通过有线连接,所述服务监控模块与存储处理模块通过有线连接,所述存储处理模块与显示模块通过有线连接。本发明还提供一种互联网舆情信息监测方法。本发明集信息采集、分析处理、服务监控、存储、显示于一体,自动发现并深入分析互联网信息热点,帮助用户方便快捷地了解舆情事件的来龙去脉。
申请公布号 CN103268350B 申请公布日期 2017.02.08
申请号 CN201310206112.8 申请日期 2013.05.29
申请人 安徽雷越网络科技有限公司 发明人 胡玉龙;李元;方谋富;石琴方;杨毛毛;李晓徽
分类号 G06F17/30(2006.01)I;G06F17/27(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 合肥天明专利事务所 34115 代理人 金凯
主权项 一种互联网舆情信息监测方法,其特征在于:包括以下步骤:1)对互联网上的舆情信息进行采集,获取网页数据;2)对获取的网页数据进行分词及语义分析预处理并将预处理结果进行存储;3)对存储的预处理结果进行统计,形成统计图表,并将形成的统计图表进行存储,以及对达到预警阈值的信息进行预警通知;4)对存储的数据进行结果显示;步骤2)中,对获取的网页数据进行分词及语义分析预处理,具体包括以下步骤:采用基于球面四叉树的多级Hash结构的分词机制对获取的网页数据进行分词处理,分词的同时根据词的语法属性、情感属性、词类属性进行词性标注,解析出词语的倾向性、主题属性;根据汉语句子的构造原则,对分词处理后的网页数据文本进行句子切分,抽取文本的每一个句子,然后对每个句子进行句法分析,将整个文本的句子的语法形成语法网状规则图;根据语义建立语义规则库,根据语义规则库将语法网状规则图通过点对点映射,转换为语义概念图;根据语义概念图判断每个网页上的文章热点指数、情感倾向性指数,分析文章主题;所述基于球面四叉树的多级Hash结构的分词机制的构建包括以下步骤:依次对每个字建立Hash索引,构成多级TRIE树;所述TRIE树的结点构成Hash桶,将每个Hash桶内存放多个具有相同的前N个字的词,N为正整数;用循环算法对建立的每一级Hash桶内的词的个数进行计算,若计算结果大于预先设定的阈值,则以该Hash桶为基础建立下一级的Hash桶,直至每个Hash桶内的词的数量均小于或等于阈值。
地址 230088 安徽省合肥市高新区黄山路605号民创中心大厦423室