发明名称 |
一种分布式搜索的架构 |
摘要 |
本发明属于搜索领域,公开了一种分布式搜索的架构,一种基于文件系统的全文检索,把全文检索的功能独立出来,成为一个单独的服务,这样可以和数据库分开部署,从而减轻数据库的压力,同时增强检索服务的性能,数据库压力降低,整体性能得到提升,同时可扩展性强。 |
申请公布号 |
CN103136286A |
申请公布日期 |
2013.06.05 |
申请号 |
CN201110398424.4 |
申请日期 |
2011.12.05 |
申请人 |
上海特易信息科技有限公司 |
发明人 |
严纬 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
广州天河互易知识产权代理事务所(普通合伙) 44294 |
代理人 |
鲍子玉 |
主权项 |
一种分布式搜索架构,其特征在于,包括一个搜索引擎集群,所述搜索引擎集群位于数据库之前、应用之后,所述搜索引擎集群采用Zookeeper、Katta、HDFS、Solr为基础架构;Solr用于创建索引:通过连接到数据库,获取数据行,创建索引分片;HDFS用于存储索引:通过其中的Hadoop控制台,存储分片到HDFS上;Katta用于部署、更新以及查询索引:通过Katta控制台,发布索引分片,Katta自动部署分片到索引节点;未满的分片需要继续填充索引文档,然后更新到已发布的节点上;应用发出的查询,由Katta客户端处理:首先向索引节点发出获取索引ID的请求,进行排序等处理,然后根据ID发出获取具体的文档;Zookeeper作为分布式协调器的一部分。 |
地址 |
200030 上海市徐汇区肇嘉浜路789号8C3室 |