发明名称 |
微博热点话题自动检测方法及装置 |
摘要 |
本发明公开了一种微博热点话题自动检测方法及装置,涉及互联网技术领域,本发明通过对待检测的微博文本依次进行关键词提取、关键词组获取及关键词组聚类,以获得候选关键词簇,最后计算各个候选关键词簇所对应话题的热度值并根据热度值选择热点话题,减小了热点话题检测的复杂度,并实现有效的热点话题检测。 |
申请公布号 |
CN104615593A |
申请公布日期 |
2015.05.13 |
申请号 |
CN201310536067.2 |
申请日期 |
2013.11.01 |
申请人 |
北大方正集团有限公司;北京大学;北京北大方正电子有限公司 |
发明人 |
赵立永;于晓明;杨建武 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京路浩知识产权代理有限公司 11002 |
代理人 |
李相雨 |
主权项 |
一种微博热点话题自动检测方法,其特征在于,所述方法包括以下步骤:S1:抓取待检测的微博文本;S2:对所述微博文本进行关键词提取;S3:根据各个关键词之间的相关性,获取关键词组;S4:根据各个关键词组之间的相关性,对所述关键词组进行聚类,以获得候选关键词簇;S5:计算每个候选关键词簇所代表话题的热度值,根据所述热度值对所述候选关键词簇进行排序,按照所述热度值从大到小顺序在所述候选关键词簇中选择N个关键词簇,并将所述N个关键词簇分别代表的话题作为热点话题,所述N为不小于1的整数。 |
地址 |
100871 北京市海淀区成府路298号方正大厦 |