发明名称 基于动态语义分析的全文检索系统
摘要 本发明属于信息检索技术,提供一种基于动态语义分析的全文检索系统,包括查询信息接收模块、查询语句语义处理模块、语义知识库、词语贡献度动态计算模块、检索模块、索引库、索引模块、结果处理模块和文档集。本发明系统不仅能够动态计算和更新词语贡献度信息,而且能够对查询扩展语句进行词义消歧,筛选出符合语义的查询扩展语句,实现支持动态语义分析的全文信息检索。该系统具有更高的查准率、查全率和动态性等特点。
申请公布号 CN103678576A 申请公布日期 2014.03.26
申请号 CN201310669139.0 申请日期 2013.12.11
申请人 华中师范大学 发明人 张茂元;邹春燕;吴德钰;张红;袁芳;华丽君;罗贤亮;贺凡黎;陈水银;孟琼瑶
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 武汉天力专利事务所 42208 代理人 吴晓颖
主权项 基于动态语义分析的全文检索系统,包括查询信息接收模块、查询语句语义处理模块、语义知识库、词语贡献度动态计算模块、检索模块、索引库、索引模块、结果处理模块和文档集;所述查询信息接收模块用于接受用户输入的查询语句,根据用户的需求将查询信息提交给查询语句语义处理模块进行语义处理,或者直接提交给检索模块进行检索;所述查询语句语义处理模块用于接收查询信息接收模块提交的用户查询语句,对查询语句进行语义处理;首先对查询语句进行预处理,将查询语句进行中文分词,去停用词,得到查询词序列,然后将查询词序列提交给语义知识库,得到对应的相关词群和贡献度,采用基于语义知识库的概念扩展方法,对查询词进行扩展,用扩展词替换到相应的查询词位置上得到候选的查询扩展语句集合,再采用词义消歧方法,过滤掉语义不正确的扩展语句,最后将查询语句及其扩展语句一起提交给检索模块进行检索;所述语义知识库存储词语及其相关词群和贡献度信息,对查询语句语义处理模块提交的查询词,在库中检索,将查询词对应的相关词群及贡献度返回给查询语句语义处理模块;所述词语贡献度动态计算模块采用词语贡献度的动态计算方法,动态地计算词语的相关词对该词语的贡献度,并将计算的结果返回给语义知识库;所述检索模块用于为用户提供检索服务,检索模块接收来自查询信息接收模块的查询语句或查询语句语义处理模块处理之后的查询语句,并将查询语句提交给索引库进行查找匹配,从而得到与查询语句相关的所有文档信息,并且对相关的文档集进行排序处理,将排序后的结果提交至结果处理模块;所述索引库用于存储由索引模块对文本文件建立的索引,索引库还根据检索模块提交的查询信息在索引中快速检索,并且将检索的结果返回给检索模块;所述索引模块用于对文档集提供的文本文件建立索引,索引模块对文本内容和标题处理得到索引词,并利用索引词和文档相关信息建立索引;所述文档集存储文本文件,并将文本文件提供给索引模块建立文件的索引;所述结果处理模块用于接收来自检索模块的检索结果,并根据索引库的相关信息建立检索结果的摘要信息,并对返回结果进行分页处理。
地址 430079 湖北省武汉市武昌区珞喻路152号