发明名称 |
从文本流检测事件的方法和设备 |
摘要 |
本发明公开了一种用于从文本流检测事件的方法和设备。根据本发明的方法可以包括:对文本流进行实时预处理,以得到文本流中的每个文本的特征向量;针对经过预处理的每个文本,基于所述每个文本的特征向量执行实时在线聚类;以及基于所述实时在线聚类的结果来识别事件。根据本发明,提供了一种通过对文本流进行实时处理以从文本流中识别事件的技术方案,其具有高度的灵活性、良好的实时性和快速的响应时间。而且根据本发明的技术方案,在处理过程中无需人为干预,是一种智能化、自适应的解决方案,其尤其适用于互联网中产生的文本流。 |
申请公布号 |
CN102622378A |
申请公布日期 |
2012.08.01 |
申请号 |
CN201110035163.X |
申请日期 |
2011.01.30 |
申请人 |
北京千橡网景科技发展有限公司 |
发明人 |
高婷婷;陈冬梁 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京市金杜律师事务所 11256 |
代理人 |
吴立明 |
主权项 |
一种用于从文本流中检测事件的方法,包括:对文本流进行实时预处理,以得到文本流中的每个文本的特征向量;针对经过预处理的每个文本,基于所述每个文本的特征向量执行实时在线聚类;以及基于所述实时在线聚类的结果来识别事件。 |
地址 |
100041 北京市石景山区实兴东街11号北楼B1011室 |