发明名称 |
利用结构信息进行实体关系提取的方法和系统 |
摘要 |
本发明提供了利用结构信息进行实体关系提取的方法和系统。所述方法包括:获取文集,所述文集包括多个已标注了关系的句子;获取与所述文集中的句子结构相关的一组依存树模式;参考所述依存树模式提取所述文集中的每个句子的特征,所述特征包含该句子的结构特征;收集提取出的所述特征来训练关系标注模型;以及将所述关系标注模型应用到未经标注的句子以提取出关系实例。另外,本发明还提出了用于自动提取依存树模式的过程。与现有技术相比,本发明的关系提取系统和方法能够实现更好的性能。 |
申请公布号 |
CN101799802A |
申请公布日期 |
2010.08.11 |
申请号 |
CN200910000499.5 |
申请日期 |
2009.02.05 |
申请人 |
日电(中国)有限公司 |
发明人 |
许洪志;胡长建;沈国阳 |
分类号 |
G06F17/27(2006.01)I;G06F17/30(2006.01)I |
主分类号 |
G06F17/27(2006.01)I |
代理机构 |
北京东方亿思知识产权代理有限责任公司 11258 |
代理人 |
宋鹤;南霆 |
主权项 |
一种用于关系提取的方法,包括:获取文集,所述文集包括多个已标注了关系的句子;获取与所述文集中的句子结构相关的一组依存树模式;参考所述依存树模式提取所述文集中的每个句子的特征,所述特征包含该句子的结构特征;收集提取出的所述特征来训练关系标注模型;以及将所述关系标注模型应用到未经标注的句子以提取出关系实例。 |
地址 |
100007 北京市东城区东四十条甲22号南新仓国际大厦B座12层1222室 |