发明名称 利用结构信息进行实体关系提取的方法和系统
摘要 本发明提供了利用结构信息进行实体关系提取的方法和系统。所述方法包括:获取文集,所述文集包括多个已标注了关系的句子;获取与所述文集中的句子结构相关的一组依存树模式;参考所述依存树模式提取所述文集中的每个句子的特征,所述特征包含该句子的结构特征;收集提取出的所述特征来训练关系标注模型;以及将所述关系标注模型应用到未经标注的句子以提取出关系实例。另外,本发明还提出了用于自动提取依存树模式的过程。与现有技术相比,本发明的关系提取系统和方法能够实现更好的性能。
申请公布号 CN101799802A 申请公布日期 2010.08.11
申请号 CN200910000499.5 申请日期 2009.02.05
申请人 日电(中国)有限公司 发明人 许洪志;胡长建;沈国阳
分类号 G06F17/27(2006.01)I;G06F17/30(2006.01)I 主分类号 G06F17/27(2006.01)I
代理机构 北京东方亿思知识产权代理有限责任公司 11258 代理人 宋鹤;南霆
主权项 一种用于关系提取的方法,包括:获取文集,所述文集包括多个已标注了关系的句子;获取与所述文集中的句子结构相关的一组依存树模式;参考所述依存树模式提取所述文集中的每个句子的特征,所述特征包含该句子的结构特征;收集提取出的所述特征来训练关系标注模型;以及将所述关系标注模型应用到未经标注的句子以提取出关系实例。
地址 100007 北京市东城区东四十条甲22号南新仓国际大厦B座12层1222室