`

solrCloud分布式检索流程

阅读更多

转载自:http://blog.csdn.net/duck_genuine/article/details/17014991

solrCloud分布式检索主要流程如下:



 搜索   video,“美女斗秀场” 取按相关度排序取得2条记录~

过程是:

从集群里得知:video—>两个分片信息

 

所以请求被并行分发到两个分片搜索,各自取top2

第一次返回
返回:

shard1返回:

vid:score
1,   0.5f
2,   0.3f

shard2返回:

vid:score
3,    0.6f
4,   0.2f 


合并结果:取top2
vid:score 
3,    0.6f    (shard2)
1,    0.5f    (shard1)


再取正向文档数据:
通过主键并行去两个分片取正向文档数据:字段(vid,times,hd)
文档id分别:

3:
{vid:3,times:100,hd:1}
1:
{vid:1,times:200,hd:0}

再合并结果返回


如果是要翻页,也就是取第3到第4个结果,则会发起请求每一个分片返回4个结果再合并排序

 

 

 

 

 

 

 

 

 

 

 

  • 大小: 79.1 KB
分享到:
评论

相关推荐

    56 solrCloud分布式搜索与索引过程

    1. **分布式检索流程**: - **查询分发**:客户端的查询请求被分发到所有的shard副本。 - **本地搜索**:每个shard副本在其本地索引上执行搜索操作。 - **结果汇总**:各shard的结果被汇总到一个指定的节点,通常...

    基于SolrCloud的分布式相似性检测系统.pdf

    基于SolrCloud的分布式相似性检测系统是一项创新技术,它在文档相似性检测领域提供了一种全新的解决方案。随着数字化进程的加快,文档、论文、网页等数字文档的数量呈现出爆炸性增长。这种增长不仅带来了信息的极大...

    solr企业级全文检索

    2. **SolrCloud分布式搜索** - **SolrCloud**:Solr的分布式搜索和管理框架,支持动态集群、故障转移和负载均衡。 - **Zookeeper**:用于协调集群状态,确保数据一致性。 - **Sharding**:数据分割成多个部分(分...

    SolrCloud文档

    SolrCloud作为Apache Solr的一个核心特性,主要应用于大规模、高性能的分布式搜索场景。当系统面临海量数据索引及高并发查询请求时,SolrCloud能够提供一套完整且高效的解决方案。 #### SolrCloud的核心价值 - **...

    基于分布式集群架构下的SSM电商购物平台设计.pdf

    另外,eGoBuy还使用了SolrCloud进行搜索服务的搭建,Solr是一个基于Lucene的开源搜索服务器,可以提供全文检索和搜索服务。对于集群管理,eGoBuy采用了Zookeeper进行服务的管理和协调,确保分布式环境中的一致性和...

    solrCloud基本概念和搭建1

    SolrCloud是Apache Solr的一种分布式部署方式,从Solr 4.0版本开始引入,它结合了Zookeeper实现了一种高可用和可扩展的搜索引擎解决方案。SolrCloud基于Java开发,利用Lucene(一个强大的全文检索引擎库)进行扩展和...

    solr集群安装手册

    - **定义:** SolrCloud 是 Apache Solr 提供的一种分布式搜索解决方案,适用于需要大规模、高容错性、分布式索引及检索能力的应用场景。 - **应用场景:** 当索引数据量庞大或搜索请求并发量极高时,SolrCloud ...

    大数据Solr架构原理.pdf

    SolrCloud是Solr的分布式解决方案,它引入了新的概念和机制,如Collection、Shard和Replica,以及对Zookeeper的依赖,以实现分布式索引和搜索。SolrCloud能自动处理索引的分片、复制和负载均衡,同时提供故障切换和...

    solr 搭建和使用

    1. 分布式搜索:SolrCloud模式支持分布式部署,通过Zookeeper进行协调和管理。这使得Solr能够处理大规模数据并实现高可用性。在多台机器上启动Solr实例,并加入同一个Zookeeper集群,即可实现分布式搜索。 2. ...

    最新版linux solr-8.6.1.tgz

    4. **SolrCloud和经典模式**:Solr 8.6.1支持两种运行模式:SolrCloud(分布式模式)和经典模式(单节点)。SolrCloud适合大型集群,提供分布式索引和查询,而经典模式适用于小型部署或测试环境。 5. **配置和优化*...

    java solr开发

    总结,"java solr开发"涵盖了从安装配置、索引创建、查询优化到分布式部署的整个流程。在Solr 7.2.1版本中,开发者可以利用Java 1.8的优势,进一步提升Solr的应用性能和灵活性。无论是企业级的信息检索还是大数据...

    solr-所需要ajr包.zip

    它基于Java,提供全文检索、高亮显示、拼写检查、分类、 faceting、实时添加数据和分布式搜索等功能。在搭建和运行Solr时,依赖于一系列的库文件,其中JAR(Java Archive)包是Java应用程序的主要组成部分。"solr-所...

    apache-solr-4.0.0-ALPHA-src.gz官方包

    6. **分布式搜索**:SolrCloud是Solr的分布式搜索和处理模式,4.0版本可能已开始支持。源码可以帮助理解ZooKeeper协调下的集群管理和分布式搜索策略。 7. **插件机制**:Solr支持丰富的插件系统,允许用户自定义...

    电商搜索和新闻推荐用户画像近实时更新_final.pptx

    Solr 是一个企业级搜索应用服务器,同样基于 Lucene,但提供了更高级的特性如Web服务API接口和SolrCloud,后者支持分布式搜索和集群管理。对比来看,ES在索引速度和查询响应时间上稍逊于Solr,但在健壮性和容错性上...

    apache-solr7.7

    7. **Cloud模式**:SolrCloud是Solr的分布式管理模式,它利用Zookeeper进行集群管理和状态协调。在Solr 7.7中,用户可以更方便地创建、管理和操作分布式集合。 8. **JSON支持**:Solr 7.7增强了对JSON的支持,使其...

    最新版linux solr-8.5.2.tgz

    1. 全文检索:Solr 支持对文档中的任意文本进行快速检索,通过词根和同义词扩展,提高搜索准确性。 2. 分布式搜索:Solr 可以分布式部署,实现跨多个服务器的搜索,处理海量数据。 3. 断点续传:在更新索引或传输...

    1-7+HBase+for+Solr+介绍.zip

    2. **Solr基础知识**:Solr的工作原理、索引构建、查询优化、分布式搜索能力以及SolrCloud的集群管理。 3. **HBase与Solr集成**:介绍如何配置和使用HBase作为Solr的数据源,实现数据的实时索引和检索,包括HBase的...

    APACHE.SOLR.ESSENTIALS.2015

    - **分布式与集群**:Solr 支持分布式部署模式,可以通过 SolrCloud 进行管理和协调,实现负载均衡和故障恢复。 - **高可用性**:通过复制和分片技术,Solr 能够提供高度可用的搜索服务,即使某个节点发生故障也...

    solr4.3源代码一

    SolrCloud是Solr4.3引入的分布式搜索和管理框架,它基于ZooKeeper进行集群协调。通过Sharding和Replication,SolrCloud可以将索引分散在多个节点上,实现高可用性和负载均衡。 **Analysis组件** 在你提到的...

    solr7.5搜索框架

    6. **配置与定制**:Solr 7.5 允许开发者根据业务需求定制自己的索引和查询处理流程,通过修改XML配置文件,可以调整字段类型、复制字段、查询分析器等。 7. **JSON与XML支持**:Solr 7.5 支持JSON和XML等多种数据...

Global site tag (gtag.js) - Google Analytics