发明名称 一种分布式搜索的架构
摘要 本发明属于搜索领域,公开了一种分布式搜索的架构,一种基于文件系统的全文检索,把全文检索的功能独立出来,成为一个单独的服务,这样可以和数据库分开部署,从而减轻数据库的压力,同时增强检索服务的性能,数据库压力降低,整体性能得到提升,同时可扩展性强。
申请公布号 CN103136286A 申请公布日期 2013.06.05
申请号 CN201110398424.4 申请日期 2011.12.05
申请人 上海特易信息科技有限公司 发明人 严纬
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 广州天河互易知识产权代理事务所(普通合伙) 44294 代理人 鲍子玉
主权项 一种分布式搜索架构,其特征在于,包括一个搜索引擎集群,所述搜索引擎集群位于数据库之前、应用之后,所述搜索引擎集群采用Zookeeper、Katta、HDFS、Solr为基础架构;Solr用于创建索引:通过连接到数据库,获取数据行,创建索引分片;HDFS用于存储索引:通过其中的Hadoop控制台,存储分片到HDFS上;Katta用于部署、更新以及查询索引:通过Katta控制台,发布索引分片,Katta自动部署分片到索引节点;未满的分片需要继续填充索引文档,然后更新到已发布的节点上;应用发出的查询,由Katta客户端处理:首先向索引节点发出获取索引ID的请求,进行排序等处理,然后根据ID发出获取具体的文档;Zookeeper作为分布式协调器的一部分。
地址 200030 上海市徐汇区肇嘉浜路789号8C3室