发明名称 基于网页分类的网页搜索引擎及快速查找方法
摘要 本发明公开了一种具有分类显示的搜索引擎及快速检索方法,该搜索引擎包括处于服务器端的分类模块,用于对每一网页按照图书馆图书分类法进行分类,将分类结果索引存入网页索引库;所述结果显示模块通过分栏显示与关键词相匹配的网页索引和与关键词相关的网页分类。该搜索引擎通过网页分类信息更好地帮助用户按网页类别更快速地、更准确地通过搜索引擎寻找到用户所感兴趣的网页。
申请公布号 CN102236719A 申请公布日期 2011.11.09
申请号 CN201110207646.3 申请日期 2011.07.25
申请人 西交利物浦大学 发明人 史玉回
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 苏州创元专利商标事务所有限公司 32103 代理人 范晴
主权项 一种具有分类显示的搜索引擎,包括处于服务器端的:网页抓取和预处理模块,用于自动从网络上搜集网页,进行预处理将网页信息转化成计算机可读方式的格式化文本信息,并定期实时更新网页信息和新网页信息抓取;索引模块,用于对网页抓取和预处理模块处理后的格式化文本信息进行分词,并使每一网页与它所包含的分词及分词出现的频率建立具有关联度特征的网页索引库;查询模块,用于响应用户端的查询请求,并搜索索引模块建立的网页索引库,获得与用户端的查询请求匹配的搜索结果列表;和处于用户端的:结果显示模块,用于供用户输入关键词查询请求,并从服务器端的查询模块获得与关键词相匹配的搜索结果列表,并按照关联度由大到小的顺序排列后展示给用户;其特征在于所述搜索引擎还包括处于服务器端的分类模块,用于对每一网页按照中国图书馆图书分类法进行分类,将分类结果索引存入网页索引库;所述结果显示模块通过分栏显示与关键词相匹配的网页索引和与关键词相关的网页分类。
地址 215123 江苏省苏州市工业园区独墅湖高等教育区仁爱路111号