发明名称 | 一种基于领域知识的语义查询扩展方法 | ||
摘要 | 本发明公开了一种基于领域知识的语义查询扩展方法,包括:以概念表达和知识树体系为基础,构建领域知识;对用户的查询短语进行初步语义分析,形成语义项列表;利用初步语义分析的结果,以领域知识为基础,构建带有扩展类型和扩展权重的语义图;计算语义图中每个顶点到初始顶点间的语义距离;根据语义距离,确定语义项列表中每一项的可扩展项;最后依靠“与”“或”逻辑关系合并所有可扩展项,得到表示用户查询意向的语义项集合,并提交搜索系统进行搜索。本发明计算时间短,充分利用了领域知识,新增加的扩展语义项与原查询短语之间具有明确的语义关系,能有效的提高搜索系统的查全率和查准率。 | ||
申请公布号 | CN101630314A | 申请公布日期 | 2010.01.20 |
申请号 | CN200810116729.X | 申请日期 | 2008.07.16 |
申请人 | 中国科学院自动化研究所 | 发明人 | 杨一平;马良俊;高一波;卢朋;陈琳;任禾 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 中科专利商标代理有限责任公司 | 代理人 | 梁爱荣 |
主权项 | 1、一种基于领域知识的语义查询扩展方法,其特征在于:包括如下步骤:步骤S1:根据对领域知识和用户查询语句特征的分析,构建领域知识库,形成描述领域知识的领域知识库;步骤S2:利用领域知识库内容,对用户输入的查询语句进行初步语义处理,获得一个语义项列表;步骤S3:利用语义项列表,结合领域知识库内容,对语义项列表中的每一语义项生成语义图;步骤S4:根据语义图中顶点间的语义距离计算公式,计算每个语义图中各顶点与初始顶点间的语义距离,通过设定的阈值,选择可扩展顶点,作为查询扩展的可扩展项;步骤S5:根据语义项列表中各语义项的逻辑关系,归并由每个语义图确定的可扩展项,将所获得的可扩展项提交搜索系统进行查询,并对搜索系统的查询结果进行分析;步骤S6:参考搜索系统查询结果的召回率和准确率,调节语义图中用于计算语义距离的各可变参数,重新组织领域知识库内的知识。 | ||
地址 | 100080北京市海淀区中关村东路95号 |