发明名称 |
一种新闻事件要素抽取方法与装置 |
摘要 |
本发明提供一种新闻事件要素抽取方法,包括:识别新闻文本中包含的人名并抽取人名特征;根据所抽取的人名特征计算人名成为新闻事件的主角的概率;以及基于该概率识别出新闻事件的主角。在一些实施例中,所述方法还包括:抽取关于新闻事件的主角的观点和发言的语句,以及新闻事件发生的地点和时间。本发明在保证抽取准确率的前提下,能够克服人工分析整理新闻信息成本高、效率低的问题,同时,也为新闻事件检索、新闻报道跟踪等上层应用提供支持。 |
申请公布号 |
CN104408093A |
申请公布日期 |
2015.03.11 |
申请号 |
CN201410645944.4 |
申请日期 |
2014.11.14 |
申请人 |
中国科学院计算技术研究所 |
发明人 |
程学旗;刘倩;伍大勇;刘悦;刘冰洋;钟艳琴 |
分类号 |
G06F17/30(2006.01)I;G06F17/27(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京泛华伟业知识产权代理有限公司 11280 |
代理人 |
王勇 |
主权项 |
一种新闻事件要素抽取方法,包括:步骤1)、识别新闻文本中包含的人名并抽取人名特征;步骤2)、根据所抽取的人名特征计算人名成为新闻事件的主角的概率;以及步骤3)、基于该概率识别出新闻事件的主角。 |
地址 |
100190 北京市海淀区中关村科学院南路6号 |