发明名称 |
一种舆情信息展示系统及方法 |
摘要 |
本发明公开了一种舆情信息展示系统及方法,涉及网络信息技术领域,所述系统包括:网页抓取模块,适于抓取当前网络中包含舆情信息的网页;网页分析模块,适于对所述网页进行分析,以获得所述网页的正文信息;地域识别模块,适于对所述正文信息进行地域识别,以获得所述正文信息的所属地域,并对具有相同所属地域的网页进行数量统计;展示模块,适于将所述数量统计的结果通过地图着色的方式进行展示。本发明的系统及方法通过对包含舆情信息的网页进行地域识别,客观地、直观地反映了不同地域的舆情信息,不仅可以有效及时地发现网络中已知舆情信息的区域分布状况,还可以在未知舆情信息的萌发阶段就对重点区域进行有效的识别。 |
申请公布号 |
CN102779174B |
申请公布日期 |
2016.03.30 |
申请号 |
CN201210216349.X |
申请日期 |
2012.06.26 |
申请人 |
北京奇虎科技有限公司;奇智软件(北京)有限公司 |
发明人 |
刘付强 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京路浩知识产权代理有限公司 11002 |
代理人 |
王莹 |
主权项 |
一种舆情信息展示系统,其特征在于,所述系统包括:网页抓取模块,适于抓取当前网络中包含舆情信息的网页;网页分析模块,适于对所述网页进行分析,以获得所述网页的正文信息;地域识别模块,适于对所述正文信息进行地域识别,以获得所述正文信息的所属地域并对具有相同所属地域的网页进行数量统计;展示模块,适于将所述数量统计的结果通过地图着色的方式进行展示;其中,所述地域识别模块进一步包括:Trie树构建子模块,适于利用行政区域统计表构建双数组Trie树;匹配子模块,适于将所述正文信息中出现的名词与所述双数组Trie树进行匹配;地域获得子模块,适于利用所述匹配的结果获得所述正文信息的所属地域;其中,所述展示模块进一步包括:结果散列子模块,所述结果散列子模块,适于将所述数量统计的结果散列到颜色的色阶范围内来实现地图着色。 |
地址 |
100088 北京市西城区新街口外大街28号D座112室(德胜园区) |