发明名称 一种推送微博的方法及装置
摘要 本发明公开了一种推送微博的方法及装置,用以解决现有技术中反映某些热点舆情的微博不能被及时的推送给相应用户的问题。该方法确定在设定时间间隔内接收到的各微博中的关键词,据此确定关键词集合,并根据每两个关键词集合的交集和并集中包含的关键词,对确定出的各关键词集合进行增量聚类,针对得到的聚类关键词集合,当热点舆情库中不存在与该聚类关键词集合的相似度大于设定相似度的热点舆情关键词集合时,将与该聚类关键词相关的微博推送给相关用户。上述方法由于在聚类时无需预先设定聚类的个数,因此不会遗漏该设定时间间隔内的任何热点舆情关键词集合,可以将反映热点舆情的微博及时的推送给相应用户。
申请公布号 CN102968439B 申请公布日期 2015.11.25
申请号 CN201210385036.7 申请日期 2012.10.11
申请人 微梦创科网络科技(中国)有限公司 发明人 伏圣国
分类号 G06F17/30(2006.01)I;H04L29/08(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京同达信恒知识产权代理有限公司 11291 代理人 黄志华
主权项 一种推送微博的方法,其特征在于,包括:接收在设定时间间隔内发布的各微博,确定接收到的各微博中的关键词;根据确定出的各关键词,采用设定方法确定关键词集合,并确定采用所述设定方法所能确定出的所有关键词集合,其中,所述设定方法为:在各关键词中任意选择两个关键词构成一个关键词集合;计算确定出的各关键词集合的权重;根据确定的每个关键词集合的权重,按照权重从大到小的顺序依次选择第二设定数量的关键词集合;根据选择每个关键词集合的权重,将选择的第二设定数量的关键词集合按照权重从大到小的顺序进行排序;按照关键词集合排序的先后顺序,依次针对每个关键词集合,执行下述步骤A~B:步骤A、将当前针对的关键词集合作为待聚类关键词集合,确定排在待聚类关键词集合之前的每个关键词集合,作为前序关键词集合;步骤B、针对确定的每个前序关键词集合,确定待聚类关键词集合与该前序关键词集合的交集中包含的关键词的第一数量,确定待聚类关键词集合与该前序关键词集合的并集中包含的关键词的第二数量,当第一数量与第二数量的比值大于设定比值时,将待聚类关键词集合中满足第一指定条件的关键词添加到该前序关键词集合中,得到聚类关键词集合,其中,满足第一指定条件的关键词为:包含在该待聚类关键词集合中、且未包含在该前序关键词集合中的关键词;针对得到的每个聚类关键词集合,判断热点舆情库中是否存在与该聚类关键词集合的相似度大于设定相似度的热点舆情关键词集合,当不存在时,在接收到的各微博中,选择与该聚类关键词集合相关的微博推送给相关用户,并将该聚类关键词集合作为热点舆情关键词集合保存在所述热点舆情库中。
地址 100080 北京市海淀区海淀北二街10号701室