发明名称 |
一种突发事件数据的筛选方法及装置 |
摘要 |
本发明提供了一种突发事件数据的筛选方法及装置,其中方法主要包括:构建去噪总表、组合词表以及反向词表;根据去噪总表、组合词表以及反向词表中的一个或多个,对采集到的突发事件相关数据进行筛选。本发明通过自然语言分析,为突发事件关键词词表的构建提供了依据。为保证数据的准确率,本发明采用多词表实现突发事件数据的筛选。围绕数据的全面性和准确性,本发明还应用查准率与查全率对各词表性能进行量化评估,为词表的更新提供了依据。 |
申请公布号 |
CN106469203A |
申请公布日期 |
2017.03.01 |
申请号 |
CN201610796947.7 |
申请日期 |
2016.08.31 |
申请人 |
北京联创众升科技有限公司 |
发明人 |
刘菲菲;王芳;祝笑舟;常璐;牛珍珍;王程;汤智谦 |
分类号 |
G06F17/30(2006.01)I;G06F17/27(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京天达知识产权代理事务所(普通合伙) 11386 |
代理人 |
马东伟;龚颐雯 |
主权项 |
一种突发事件数据的筛选方法,其特征在于,包括:构建去噪总表、组合词表以及反向词表;根据所述去噪总表、所述组合词表以及所述反向词表中的一个或多个,对采集到的突发事件相关数据进行筛选。 |
地址 |
100098 北京市海淀区大钟寺东路9号京仪科技大厦B座B103A室 |