发明名称 一种新闻事件要素抽取方法与装置
摘要 本发明提供一种新闻事件要素抽取方法,包括:识别新闻文本中包含的人名并抽取人名特征;根据所抽取的人名特征计算人名成为新闻事件的主角的概率;以及基于该概率识别出新闻事件的主角。在一些实施例中,所述方法还包括:抽取关于新闻事件的主角的观点和发言的语句,以及新闻事件发生的地点和时间。本发明在保证抽取准确率的前提下,能够克服人工分析整理新闻信息成本高、效率低的问题,同时,也为新闻事件检索、新闻报道跟踪等上层应用提供支持。
申请公布号 CN104408093A 申请公布日期 2015.03.11
申请号 CN201410645944.4 申请日期 2014.11.14
申请人 中国科学院计算技术研究所 发明人 程学旗;刘倩;伍大勇;刘悦;刘冰洋;钟艳琴
分类号 G06F17/30(2006.01)I;G06F17/27(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京泛华伟业知识产权代理有限公司 11280 代理人 王勇
主权项 一种新闻事件要素抽取方法,包括:步骤1)、识别新闻文本中包含的人名并抽取人名特征;步骤2)、根据所抽取的人名特征计算人名成为新闻事件的主角的概率;以及步骤3)、基于该概率识别出新闻事件的主角。
地址 100190 北京市海淀区中关村科学院南路6号