发明名称 一种基于领域知识的语义查询扩展方法
摘要 本发明公开了一种基于领域知识的语义查询扩展方法,包括:以概念表达和知识树体系为基础,构建领域知识;对用户的查询短语进行初步语义分析,形成语义项列表;利用初步语义分析的结果,以领域知识为基础,构建带有扩展类型和扩展权重的语义图;计算语义图中每个顶点到初始顶点间的语义距离;根据语义距离,确定语义项列表中每一项的可扩展项;最后依靠“与”“或”逻辑关系合并所有可扩展项,得到表示用户查询意向的语义项集合,并提交搜索系统进行搜索。本发明计算时间短,充分利用了领域知识,新增加的扩展语义项与原查询短语之间具有明确的语义关系,能有效的提高搜索系统的查全率和查准率。
申请公布号 CN101630314A 申请公布日期 2010.01.20
申请号 CN200810116729.X 申请日期 2008.07.16
申请人 中国科学院自动化研究所 发明人 杨一平;马良俊;高一波;卢朋;陈琳;任禾
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 中科专利商标代理有限责任公司 代理人 梁爱荣
主权项 1、一种基于领域知识的语义查询扩展方法,其特征在于:包括如下步骤:步骤S1:根据对领域知识和用户查询语句特征的分析,构建领域知识库,形成描述领域知识的领域知识库;步骤S2:利用领域知识库内容,对用户输入的查询语句进行初步语义处理,获得一个语义项列表;步骤S3:利用语义项列表,结合领域知识库内容,对语义项列表中的每一语义项生成语义图;步骤S4:根据语义图中顶点间的语义距离计算公式,计算每个语义图中各顶点与初始顶点间的语义距离,通过设定的阈值,选择可扩展顶点,作为查询扩展的可扩展项;步骤S5:根据语义项列表中各语义项的逻辑关系,归并由每个语义图确定的可扩展项,将所获得的可扩展项提交搜索系统进行查询,并对搜索系统的查询结果进行分析;步骤S6:参考搜索系统查询结果的召回率和准确率,调节语义图中用于计算语义距离的各可变参数,重新组织领域知识库内的知识。
地址 100080北京市海淀区中关村东路95号