发明名称 | 一种分布式企业信息垂直搜索方法 | ||
摘要 | 本发明特别涉及一种分布式企业信息垂直搜索方法。该分布式企业信息垂直搜索方法,采用数据采集模块使用网络爬虫到相关信息的网站爬取相关网页;通过数据索引模块对爬取的相关网页数据进行清洗,并建立索引;通过综合搜索模块和企业搜索模块接收查询关键词,并提交给solr服务,从建立的索引文件中进行查询;通过用户权限管理模块完成系统用户权限管理,根据权限对查询结果进行按需推送。该分布式企业信息垂直搜索方法,是针对企业的专业搜索方法,是对通用搜索引擎的细分和延伸,解决了通用搜索引擎的信息量大、查询不准确、深度不够等问题,能够针对税务领域提供有特定价值的信息和相关服务。 | ||
申请公布号 | CN104899268A | 申请公布日期 | 2015.09.09 |
申请号 | CN201510269583.2 | 申请日期 | 2015.05.25 |
申请人 | 浪潮集团有限公司 | 发明人 | 范莹;于治楼 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 济南信达专利事务所有限公司 37100 | 代理人 | 姜明 |
主权项 | 一种分布式企业信息垂直搜索方法,其特征在于:包括数据采集模块,数据索引模块,综合搜索模块,企业搜索模块和用户权限管理模块;首先,所述数据采集模块使用网络爬虫到相关信息的网站爬取相关网页;然后,所述数据索引模块对爬取的相关网页数据进行清洗,并建立索引;第三,所述综合搜索模块和企业搜索模块接收查询关键词,并提交给solr服务,从建立的索引文件中进行查询;最后,所述用户权限管理模块完成系统用户权限管理,根据权限对查询结果进行按需推送。 | ||
地址 | 250101 山东省济南市高新区浪潮路1036号 |