发明名称 利用结构信息进行实体关系提取的方法和系统
摘要 本发明提供了利用结构信息进行实体关系提取的方法和系统。所述方法包括:获取文集,所述文集包括多个已标注了关系的句子;获取与所述文集中的句子结构相关的一组依存树模式;参考所述依存树模式提取所述文集中的每个句子的特征,所述特征包含该句子的结构特征;收集提取出的所述特征来训练关系标注模型;以及将所述关系标注模型应用到未经标注的句子以提取出关系实例。另外,本发明还提出了用于自动提取依存树模式的过程。与现有技术相比,本发明的关系提取系统和方法能够实现更好的性能。
申请公布号 CN101799802B 申请公布日期 2014.04.23
申请号 CN200910000499.5 申请日期 2009.02.05
申请人 日电(中国)有限公司 发明人 许洪志;胡长建;沈国阳
分类号 G06F17/27(2006.01)I;G06F17/30(2006.01)I 主分类号 G06F17/27(2006.01)I
代理机构 北京东方亿思知识产权代理有限责任公司 11258 代理人 宋鹤;南霆
主权项 一种用于关系提取的方法,包括: 获取文集,所述文集包括多个已标注了关系的句子; 获取与所述文集中的句子结构相关的一组依存树模式; 参考所述依存树模式提取所述文集中的每个句子的特征,所述特征包含该句子的上下文特征和依存树特征,其中提取所述依存树特征的步骤包括: 解析所述文集中的每个句子,以得到相关的依存树; 通过比较所述相关依存树和已提取出的所述依存树模式来构造针对该句子的依存树特征,其中针对每个句子的所述依存树特征由一n×m矩阵构成,其中m是所述提取出的依存树模式的数目,n是该句子的相关依存树所包含的节点的数目,并且对于每种依存树模式,如果该句子的相关依存树满足该依存树模式,则在所述n×m矩阵中与该依存树模式相对应的列中,与该依存树模式的每个节点相对应的矩阵元素被设置为1,其它元素被设置为0; 收集提取出的所述特征来训练关系标注模型;以及 将所述关系标注模型应用到未经标注的句子以提取出关系实例。 
地址 100007 北京市东城区东四十条甲22号南新仓国际大厦B座12层1222室
您可能感兴趣的专利