发明名称 微博概括
摘要 公开了微博概括。各实施例提供了概括技术,该概括技术可应用于博客或微博以便以缩短的形式呈现被判定为有用的信息。在一个或更多个实施例中,一种方法用来从诸如免费文本等各种资源中自动获取概念组。这些所获取的概念然后用来指导聚类处理。对簇进行排名,并随后通过合并词的频率和情感来概括簇。
申请公布号 CN102982124A 申请公布日期 2013.03.20
申请号 CN201210453572.6 申请日期 2012.11.13
申请人 微软公司 发明人 安妮·路易斯;托德·纽曼
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京集佳知识产权代理有限公司 11227 代理人 郎晓虹;李春晖
主权项 一种方法,该方法包括:处理(600)多个资源以构建词典,所述词典配置为使得能够概括多条微博;使用(602)所述词典创建概念,至少一些个体概念包括含有多个词的语义标签;将多条微博分配(604)给多个所述概念以有效地形成潜在簇;计算(606)每个微博/簇对的成员分数;以及使用(606)所述成员分数将微博分配给簇。
地址 美国华盛顿州