发明名称 基于相关词语语义分析的全文检索系统
摘要 本发明属于信息检索技术,提供一种基于相关词语语义分析的全文检索系统,包括查询信息接收模块、基于相关词语的概念语义分析模块、语义知识库模块、检索模块、索引库、索引模块、基于相关词语的主题语义分析模块、结果集处理模块和数据服务器。本发明系统是对传统互联网搜索引擎的改进,能够对文档进行基于相关词语的概念语义分析和基于相关词语的主题语义分析,从而使用户可得到更准确、更全面、更智能化的查询结果。
申请公布号 CN103838833A 申请公布日期 2014.06.04
申请号 CN201410061245.5 申请日期 2014.02.24
申请人 华中师范大学 发明人 张茂元;邹春燕;陈水银;张红;管益龙;贺凡黎;华丽君;罗贤亮;吴德钰;袁芳;孟琼瑶
分类号 G06F17/30(2006.01)I;G06F17/27(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 武汉天力专利事务所 42208 代理人 吴晓颖
主权项 基于相关词语语义分析的全文检索系统,包括查询信息接收模块、基于相关词语的概念语义分析模块、语义知识库模块、检索模块、索引库、索引模块、基于相关词语的主题语义分析模块、结果集处理模块和数据服务器;所述查询信息接收模块用于接收用户输入的查询语句,对查询语句进行中文分词和去停用词处理之后,将其提交给基于相关词语的概念语义分析模块并且提交给检索模块进行检索服务;所述基于相关词语的概念语义分析模块采用基于相关词语的概念语义分析方法,得到词语之间的语义相关量化关系,并提交给语义知识库模块;所述语义知识库模块用来存储词语及其相关词群和贡献度信息,从查询信息接收模块中得到用户输入的查询词,在语义知识库中检索,将查询词对应的相关词群及贡献度返回给基于相关词语的概念语义分析模块;所述检索模块为用户提供检索服务,检索模块负责接收查询信息接收模块的指令,将查询语句提交给索引库进行查询匹配,返回所有与查询语句匹配的文档信息,并对检索结果集进行排序处理,将排序后的结果集提交给结果集处理模块;所述索引库用来存储由索引模块对文档建立的索引,索引库还根据检索模块提交的查询请求在索引中快速检索,并将结果返回给检索模块;所述索引模块用来接收数据服务器提供的文档,对文档内容,标题和自定义信息进行中文分词和去停用词处理得到索引词,利用索引词和文档相关信息建立索引;所述基于相关词语的主题语义分析模块采用基于相关词语的主题语义分析方法,通过对文档进行主题语义分析,得到每个词与文档之间的语义相关量化关系,即对文档主题的贡献度,最后把这些运用到检索中提高搜索引擎的检索效果;所述结果集处理模块用于接收来自检索模块的结果集,并根据索引库的信息建立结果集的文摘信息和快照信息,并对返回结果进行反显、回显和分页处理;所述数据服务器用于存储知识数据词典、文档集,为基于相关词语的概念语义分析模块提供数据资源和管理服务,为基于相关词语的主题语义分析模块和索引模块提供文档集。
地址 430079 湖北省武汉市武昌区珞喻路152号