发明名称 |
一种基于互联网信息的事件预警方法 |
摘要 |
本发明公开了一种基于互联网信息的事件预警方法,属于信息技术领域。其方法为:1)对每一设定网站进行网页信息爬取并保存,得到与事件相关的信息;2)对爬取得到的与事件相关的信息进行垃圾信息过滤;3)建立事件信息本体,基于所述事件信息本体中的实例名称和属性采用模式匹配方法对过滤后的信息进行分类;4)对分类后的信息按照设定特征进行聚类,得到每一类信息中所包含的事件;5)定期计算每一事件的各特征参数值,如果某事件的各特征参数值和其之前一定时期内的均值之间的差值超过事先设定的阈值,则对该事件进行预警。本发明保证了食品安全事件信息识别、预警的及时性、准确性、全面性,提高了食品安全风险预警的效率。 |
申请公布号 |
CN103176983B |
申请公布日期 |
2016.04.27 |
申请号 |
CN201110430949.1 |
申请日期 |
2011.12.20 |
申请人 |
中国科学院计算机网络信息中心 |
发明人 |
杨风雷;黎建辉 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京君尚知识产权代理事务所(普通合伙) 11200 |
代理人 |
余长江 |
主权项 |
一种基于互联网信息的事件预警方法,其步骤为:1)对每一设定网站进行网页信息爬取并保存,得到与事件相关的信息;2)对爬取得到的与事件相关的信息进行垃圾信息过滤;其中,所述过滤方法包括对一网站爬取得到的与事件相关的信息进行非欺骗性垃圾意见的垃圾信息过滤,其方法为:a)选取部分与事件相关的信息,并对其进行标注,得到垃圾信息集合和非垃圾信息集合;b)从信息内容、信息内容分布、信息链接特征三个纬度对所述垃圾信息集合和非垃圾信息集合样本进行特征提取,生成每一维度的特征向量;c)采用机器学习方法基于所述垃圾信息集合和非垃圾信息集合建立基于每一维度特征的非欺骗性垃圾意见的垃圾信息检测模型;d)利用所述非欺骗性垃圾意见的垃圾信息检测模型对所述与事件相关的信息进行非欺骗性垃圾意见的垃圾信息过滤;3)建立事件信息本体,基于所述事件信息本体中的实例名称和属性采用模式匹配方法对过滤后的信息进行分类;4)对分类后的信息按照设定特征进行聚类,得到每一类信息中所包含的事件;5)定期计算每一事件的各特征参数值;如果某事件的各特征参数值和其之前一定时期内的均值之间的差值超过事先设定的阈值,则对该事件进行预警。 |
地址 |
100190 北京市海淀区中关村南四街4号 |