发明名称 一种基于社交网络大数据的空气质量预警和监测分析系统
摘要 本发明公开了一种空气质量预警和监测分析系统,对社交网络中的文本信息进行收集和分词,与空气质量词库进行对比分类计算,再进行信息的情绪判断,计算情感系数;通过文本的地理位置信息选定该位置范围内的空气监测站的数据作为真值,对比该位置范围内的文本信息的情感系数,建立两者之间的映射关系,达到分析和预警整个城市的空气质量的目的。本发明中公开的空气质量预警和监测分析系统采用了带有地理信息的社交网络数据,大大地降低了监测成本,并且监测覆盖面广,反应迅速,预测精确度高。
申请公布号 CN105893352A 申请公布日期 2016.08.24
申请号 CN201610234831.4 申请日期 2016.04.15
申请人 苏州爱诺信信息科技有限公司 发明人 刘富强
分类号 G06F17/27(2006.01)I 主分类号 G06F17/27(2006.01)I
代理机构 代理人
主权项 一种基于社交网络数据的空气质量预警和监测分析系统,其特征在于,包括以下步骤:1)收集社交网络中监控目标在一段时间内的文本信息I,并将所述的文本信息I按时间标记,数据形式为(I,时间戳);2)利用中文分词系统对所述的文本信息I进行分词,获得长度大于等于2的名词、动词和名动词序列,以及识别情感词、程度词和否定词;3)判断所述的文本信息I是否带有地理信息,所述的地理信息包括社交网站提供的地理信息戳和步骤2)中的分词结果,对带有地理信息的所述文本信息I进行下一步处理;4)基于空气质量词库的分类计算,对所述的文本信息I构建信息聚类模型,确定与空气质量相关的文本信息I;5)采用NTUSD法对所述相关的文本信息I进行情绪因素判断,计算情感系数eV值;6)建立向量空间模型来表示每个所述相关的文本信息,表示为RI:(I,地理位置,时间戳,情感系数eV)7)定义地理区块:将一个城市分割成若干区块,每个所述的区块都有一个地理坐标g.loc、一个AQI标签g.Q和所述相关的文本信息集合{g.RIi},并且将每个所述的区块关联一个已有的空气监测站的位置,将所述的空气检测站的数据作为所述的区块的空气质量真值。8)将所述相关的文本信息向量输入基于监测站数据的学习预测模型,将在所述的空气监测站所在区块的相关文本信息作为标记数据,所述的标记数据中随机选取90%的信息归类为训练信息样本;剩下的10%的信息归类为测试信息样本,通过CRF分类器监督学习,建立信息数据g.RI和空气质量g.Q的映射关系g.Q=f({g.RIi})。9)使用非标记数据代入所述的学习预测模型,应用映射关系g.Q=f({g.RIi}),分析出整个城市各个地理区块的空气质量。10)对空气质量进行预警处理,监控每一个地理区块的情感系数{g.RIi.eV},通过均值和方差按照3σ原则确定合理区间,当某一区块的瞬时变化率超过合理区间时进行预警。
地址 215500 江苏省常熟市高新技术产业开发区湖山路333号同济科技广场1幢2302