发明名称 |
一种基于多特征语义树核的关系抽取方法和信息检索方法 |
摘要 |
本发明公开一种基于多特征语义树核的关系抽取方法,以及应用该方法进行文本信息检索的方法,属于自然语言处理技术领域。该关系抽取方法主要包含:面向句法分析树关系表述表示的特征扩展机制;基于上述特征扩展机制的句法树内容特征扩展;融合内容特征和句法分析树结构特征的多特征语义树核。面向句法分析树的特征扩展机制将特定关系表述的句法结构和内容特征置于统一的表示框架之中进行表示。句法树特征扩展将关系表述的重要语义信息和内容信息融入到句法树表示中。多特征语义树核提供了一种有效和高性能的算法,可综合关系表述的句法结构和内容特征进行综合判断。 |
申请公布号 |
CN104699695A |
申请公布日期 |
2015.06.10 |
申请号 |
CN201310652675.X |
申请日期 |
2013.12.05 |
申请人 |
中国科学院软件研究所 |
发明人 |
韩先培;孙乐 |
分类号 |
G06F17/30(2006.01)I;G06F17/27(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京君尚知识产权代理事务所(普通合伙) 11200 |
代理人 |
余长江 |
主权项 |
一种基于多特征语义树核的关系抽取方法,其步骤包括:1)在句法分析树的每一个节点处加入用于表示内容特征的特征向量,以统一表示关系表述的句法结构特征和内容特征;2)对句法分析树中的每一个树节点,抽取表示其内容特性的一系列特征,并将该一系列特征加入到树节点的特征向量中,从而形成多特征扩展句法分析树;3)基于所述多特征扩展句法分析树构建多特征语义树核,通过该多特征语义树核综合利用句法结构特征和内容特征计算不同句法分析树之间的相似度,得到可靠的关系抽取结果。 |
地址 |
100190 北京市海淀区中关村南四街4号 |