发明名称 |
针对新闻事件的聚合提取方法及装置 |
摘要 |
本发明涉及一种针对新闻事件的聚合提取方法及装置,其中,该方法包括获取各个新闻源的新闻;对来自不同新闻源的所述新闻两两之间进行相关度计算,当相关度大于设定值时,将两新闻确定为针对同一事件的新闻并建立一事件新闻组,相关联的两新闻位于同一事件新闻组;对同一事件新闻组内各个新闻的文本内容进行汇编形成针对同一事件不同新闻源的文本内容集,并将该文本内容集加载至同一网页页面;所述文本内容包括新闻标题及正文;根据用户发出的访问请求,打开网页页面展示同一事件不同新闻源的文本内容集。本发明提高用户从网络上获取新闻信息的准确性以及用户浏览新闻的效率。 |
申请公布号 |
CN106021351A |
申请公布日期 |
2016.10.12 |
申请号 |
CN201610303436.7 |
申请日期 |
2016.05.10 |
申请人 |
深圳职业技术学院 |
发明人 |
李华基 |
分类号 |
G06F17/30(2006.01)I;G06F17/27(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
广州市南锋专利事务所有限公司 44228 |
代理人 |
郑学伟;叶利军 |
主权项 |
一种针对新闻事件的聚合提取方法,其特征在于,包括:获取各个新闻源的新闻;对来自不同新闻源的所述新闻两两之间进行相关度计算,当相关度大于设定值时,将两新闻确定为针对同一事件的新闻并建立一事件新闻组,相关联的两新闻位于同一事件新闻组;对同一事件新闻组内各个新闻的文本内容进行汇编形成针对同一事件不同新闻源的文本内容集,并将该文本内容集加载至同一网页页面;所述文本内容包括新闻标题及正文;根据用户发出的访问请求,打开网页页面展示同一事件不同新闻源的文本内容集。 |
地址 |
518054 广东省深圳市西丽湖镇西丽湖畔 |