发明名称 |
一种事件信息挖掘并预警的方法 |
摘要 |
本发明公开了一种事件信息挖掘并预警的方法,属于信息技术领域。本方法为:1)建立事件信息本体,对爬取的互联网信息进行过滤,得到与事件相关的信息;2)基于所述事件信息本体中的实例名称和属性对过滤后的信息进行分类;3)对分类后的信息按照设定特征进行聚类,得到每一类信息中所包含的事件;4)定期计算每一事件的信息页面数、页面浏览数、页面转发数、信息来源区域数、信息来源网站数以及综合指数等事件特征参数值;5)如果某事件的各特征参数值和其之前一定时期内的均值之间的差值超过事先设定的阈值,则对该事件进行预警。本发明保证了食品安全事件信息发现、预警的准确性和全面性,提高了食品安全风险预警的效率。 |
申请公布号 |
CN103176981B |
申请公布日期 |
2016.04.27 |
申请号 |
CN201110430831.9 |
申请日期 |
2011.12.20 |
申请人 |
中国科学院计算机网络信息中心 |
发明人 |
杨风雷;崔建业;汪海燕;黎建辉 |
分类号 |
G06F17/30(2006.01)I;G06Q10/04(2012.01)I;G06Q50/26(2012.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京君尚知识产权代理事务所(普通合伙) 11200 |
代理人 |
余长江 |
主权项 |
一种事件信息挖掘并预警的方法,其步骤为:1)建立事件信息本体,并基于所述事件信息本体对爬取的互联网信息进行过滤,得到与事件相关的信息;然后对爬取得到的与事件相关的信息进行非欺骗性垃圾意见的垃圾信息过滤:a)选取部分与事件相关的信息,并对其进行标注,得到垃圾信息集合和非垃圾信息集合;b)从信息内容、信息内容分布、信息链接特征三个纬度对所述垃圾信息集合和非垃圾信息集合样本进行特征提取,生成每一维度的特征向量;c)采用机器学习方法基于所述垃圾信息集合和非垃圾信息集合建立基于每一维度特征的非欺骗性垃圾意见的垃圾信息检测模型;d)利用所述非欺骗性垃圾意见的垃圾信息检测模型对所述与事件相关的信息进行非欺骗性垃圾意见的垃圾信息过滤;2)基于所述事件信息本体中的实例名称和属性采用模式匹配方法对过滤后的信息进行分类;3)对分类后的信息按照设定特征进行聚类,得到每一类信息中所包含的事件;4)定期计算每一事件的各特征参数值;如果某事件的各特征参数值和其之前一定时期内的均值之间的差值超过事先设定的阈值,则对该事件进行预警。 |
地址 |
100190 北京市海淀区中关村南四街4号 |