发明名称 |
基于微博社交网络的话题自动推荐方法及其系统 |
摘要 |
本发明公开了一种基于微博社交网络的话题自动推荐方法及其系统,方法包括:对每条微博内容进行预处理;使用增量双词主题模型对预处理后的文字内容进行主题预测,得到每条微博对应的主题;根据用户的历史微博数据对应的主题建立相应的隐含狄利克雷分布模型;根据隐含狄利克雷分布模型挖掘用户的兴趣分布;从新发布的微博内容中抽取预设数量的微博内容重新挖掘用户的兴趣分布,并删除发布最早的微博内容;根据用户的兴趣分布向用户推荐相应内容。本发明具有如下优点:对微博社交网络平台用户发送的新微博自动推荐合适的话题。话题不仅可以帮助用户和微博平台对海量微博内容进行管理,也能在很多自然语言处理应用场景下提高现有系统的准确性。 |
申请公布号 |
CN105447179A |
申请公布日期 |
2016.03.30 |
申请号 |
CN201510924866.6 |
申请日期 |
2015.12.14 |
申请人 |
清华大学 |
发明人 |
徐华;李佳 |
分类号 |
G06F17/30(2006.01)I;G06F17/27(2006.01)I;G06Q50/00(2012.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京清亦华知识产权代理事务所(普通合伙) 11201 |
代理人 |
张大威 |
主权项 |
一种基于微博社交网络的话题自动推荐方法,其特征在于,包括以下步骤:S1:对用户的每条微博内容进行预处理,预处理后文字内容至少包括两个词;S2:使用增量双词主题模型对所述预处理后的文字内容进行主题预测,得到每条微博对应的主题;S3:根据用户的历史微博数据对应的主题建立相应的隐含狄利克雷分布模型;S4:根据所述隐含狄利克雷分布模型挖掘所述用户的兴趣分布;S5:从所述用户新发布的微博内容中抽取预设数量的微博内容重新挖掘所述用户的兴趣分布,并删除发布时间最早的微博内容;以及S6:根据所述用户的兴趣分布向所述用户推荐相应内容。 |
地址 |
100084 北京市海淀区100084-82信箱 |