发明名称 | 一种基于数据库同步的舆情分析系统优化方法 | ||
摘要 | 本发明公开了一种基于数据库同步的舆情分析系统优化方法,在数据库同步环节对数据进行筛选,通过控制进入舆情分析系统的数据,进行舆情分析系统优化;在采集信息导入舆情分析系统时,在数据同步模块中加入舆情包含词库、舆情排除词库信息,把数据库模块中的信息分词后,先后比对这两个词库中的词汇,若这条信息的词汇里有舆情包含词库词汇且没有舆情排除词库的词汇,则这条信息是舆情信息导入到舆情分析系统里,这样减小了舆情分析系统数据量的压力,提升了分析灵敏度和分析结果的准确性。 | ||
申请公布号 | CN103984777A | 申请公布日期 | 2014.08.13 |
申请号 | CN201410248277.6 | 申请日期 | 2014.06.06 |
申请人 | 浪潮电子信息产业股份有限公司 | 发明人 | 程瑶;刘粉粉;陈大雅 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 济南信达专利事务所有限公司 37100 | 代理人 | 姜明 |
主权项 | 一种基于数据库同步的舆情分析系统优化方法,其特征在于, 在数据库同步环节对数据进行筛选,通过控制进入舆情分析系统的数据,进行舆情分析系统优化;所述舆情分析系统优化方法提出了一种优化舆情分析系统,所述优化舆情分析系统的体系结构包括:数据库模块、数据同步模块和舆情分析系统;其中,所述数据库模块是存储舆情信息的模块,所述数据库模块为舆情采集系统的一部分,是最终存储采集信息的模块;所述数据同步模块是数据库模块和舆情分析系统的桥梁,通过该数据同步模块把舆情信息传送到舆情分析系统里;所述数据同步模块中包括分词库、舆情包含词库、舆情排除词库,所述舆情包含词库里包括典型舆情词汇,所述舆情排除词库里包括典型的非舆情词汇;所述舆情分析系统提供舆情分析功能;所述舆情分析系统优化方法,在采集信息导入舆情分析系统时,加入了信息筛选过滤操作,只往舆情分析系统中导入舆情信息;即在数据库同步时,在数据同步模块中添加舆情包含词库、舆情排除词库信息,对采集信息进行词汇对比过滤,通过在这两种不同的词库之间过滤信息的逻辑关系,把数据库模块中的信息筛选过滤出来,只把通过筛选的信息导入到舆情分析系统里,进行舆情分析。 | ||
地址 | 250014 山东省济南市高新区舜雅路1036号 |