发明名称 一种基于迭代模型的中文百科知识图谱分类体系构建方法
摘要 本发明公开了一种基于迭代模型的中文百科知识图谱分类体系构建方法。知识图谱分类体系中包含两类节点:实体节点和类目节点,以及两类关系:Subclass‑of关系和Instance‑of关系。Subclass‑of关系用来描述类目节点之间的上下位层次关系,而Instance‑of关系则用来描述实体节点和类目节点之间的从属关系。结构化中文百科知识图谱中的实体和类目特征;接着,判断类目和类目之间的上下位关系Subclass‑of,以及实体和类目之间的从属关系Instance‑of;最后利用每个类目关联的Instance‑of关系重新计算类目的结构化特征,再利用新的类目特征重新判断Subclass‑of关系和Instance‑of关系。迭代进行以上两个步骤,直到Instance‑of关系不再变化。本迭代方法对Subclass‑of关系和Instance‑of关系的判断结果提升显著,是一种构建中文百科知识图谱分类体系的创新方法。
申请公布号 CN105787105A 申请公布日期 2016.07.20
申请号 CN201610161218.4 申请日期 2016.03.21
申请人 浙江大学 发明人 鲁伟明;楼仁杰;邵健;庄越挺;吴飞
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 杭州求是专利事务所有限公司 33200 代理人 郑海峰
主权项 一种基于迭代模型的中文百科知识图谱分类体系构建方法,其特征在于包括如下步骤:1)对中文百科知识图谱中的实体进行结构化表达;2)利用中文百科信息中已有的类目与实体之间的关联,通过对实体特征求并集的方法,对知识图谱中的类目进行结构化表达;3)利用类目的结构化特征,训练支持向量机模型判断两个类目之间是否存在上下位关系Subclass‑of;4)利用实体和类目的结构化特征,以及类目之间的Subclass‑of关系约束,在满足Instance‑of关系传递性的前提下,用非线性整数规划方法判断实体和类目之间的Instance‑of关系;5)判断步骤4)中获得的Instance‑of关系是否有变化,若没有则结束迭代,若有变化则执行步骤6);6)利用步骤4)中得到的Instance‑of关系,重新计算类目的结构化特征,然后跳至步骤3)。
地址 310027 浙江省杭州市西湖区浙大路38号
您可能感兴趣的专利