发明名称 |
一种热搜词生成方法及系统 |
摘要 |
本发明提供了一种热搜词的生成方法和装置,其中方法包括:对抓取到的新闻页面进行聚类,形成各新闻簇;确定所述新闻簇中的热点新闻簇;从所述热点新闻簇的新闻页面中提取核心词;按照提取的核心词对应的搜索效果确定出热搜词,其中所述热搜词覆盖所述提取出的核心词中的一个或多个。本发明能够实现热搜词的自动生成,无需人工干预,降低了人为工作量,并且不再依赖编辑人员对热点事件的敏感度,提高了热搜词的准确性。 |
申请公布号 |
CN102004792B |
申请公布日期 |
2012.10.10 |
申请号 |
CN201010585538.5 |
申请日期 |
2010.12.07 |
申请人 |
百度在线网络技术(北京)有限公司 |
发明人 |
彭学政;蔡勋梁;柳杨 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
深圳市威世博知识产权代理事务所(普通合伙) 44280 |
代理人 |
何青瓦;李庆波 |
主权项 |
一种热搜词的生成方法,其特征在于,该方法包括:A、对抓取到的新闻页面进行聚类,形成各新闻簇;B、确定所述新闻簇中的热点新闻簇;C、从所述热点新闻簇的新闻页面中提取核心词;D、按照提取出的核心词对应的搜索效果确定出热搜词,其中所述热搜词覆盖所述提取出的核心词中的一个或多个。 |
地址 |
100085 北京市海淀区上地十街10号百度大厦 |