发明名称 一种面向领域数据的语义检索方法
摘要 本发明公开了一种面向领域数据的语义检索方法,利用本体来描述某个领域的语义信息,使得计算机更准确得理解用户查询内容,进而实现语义层面的检索,在分析现有技术的基础上,结合语义网本体的结构特点,提出了一种面向领域数据的语义索引模型,模型根据关键词在本体中的位置推断关键词与不同实例之间的语义相关度,将相关度权重写入关键词对应的实例倒排列表,降低了语义检索时相似度计算的复杂度,提高了检索的效率。本发明所述方法将检索从关键字简单匹配的语法层次提高到计算机可以理解的语义层次,使计算机能够读懂输入的关键词,从而实现了检索的智能化。
申请公布号 CN104239513A 申请公布日期 2014.12.24
申请号 CN201410471778.0 申请日期 2014.09.16
申请人 西安电子科技大学 发明人 宋胜利;高海昌;覃桂敏;褚华
分类号 G06F17/30(2006.01)I;G06F17/27(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京科亿知识产权代理事务所(普通合伙) 11350 代理人 汤东凤
主权项 一种面向领域数据的语义检索方法,其特征在于,包括以下步骤:(1)借助本体管理工具完成本体概念库的构建,利用语义标注工具进行标注得到实例数据集;(2)根据本体概念、实例、属性之间的相互关系设定不同短语与实例的相关度权重,遍历实例数据集,构建语义数据索引;(3)用户输入查询语句,利用分词工具对用户查询语句进行分词处理;(4)利用本体概念连通图和上下文分析对用户查询进行语义扩展,形成新的单词集合;(5)用新的单词集合作为原始词,进行语义检索,得到相关实例集合;(6)将检索得到的实例集合按照相关度权值大小进行排序;(7)将检索结果返回给用户。
地址 710000 陕西省西安市雁塔区太白南路2号