`
tovegar
  • 浏览: 31347 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

怎样搭建solr分布式索引平台?

阅读更多
用了半年的solr才能确实的感觉到lucene的优点。
正如robbin所说:“但是这个方案的缺点也是显而易见的,你的RoR应用所有的全文检索都要依赖后台再次向solr服务器发送web请求来获取结果,单个页面的执行速度肯定会受限于后台的跨http的web请求,这对于那些对全文检索功能依赖特别多的网站来说,恐怕很难接受”。
还有全文索引比较忌讳单个索引文件太大,如果太大,搜索的效率降低不说,做优化都比较耗资源,而且最头疼的就是“out of memeory”这个错误,人数一多肯定是不行。
lucene提供了多个索引文件的查询基本可以解决索引过大的问题,但是solr呢?
曾经考虑过建立多个solr服务,这种方式效率低,而且对于查询分页问题基本上没有办法解决。PASS了。

网上查资料之后才知道,CollectionDistribution(solr分布)可以缓解这个问题。
但是网上说的很少,而且solr主站也看的不是很明白(e文不好)
不知道有没有人用过CollectionDistribution,效率和效果如何?怎么样搭建整个过程?请指教
分享到:
评论
8 楼 程序-曹龙 2012-06-18  
    
7 楼 damoqingquan 2008-10-07  
请问solr查询参数indent=on是什么意思?
6 楼 insky 2008-07-25  
问个问题: solr查询时 对多个关键词 如:  java j2EE struts spring有没有优先级别或者权重区分?  输入多个关键词时solr是如何处理的?
4 楼 chenlb 2008-07-10  
我在虚拟机试了一下, 但还不够深度.

http://chenlb.iteye.com/blog/211807
3 楼 insky 2008-04-18  
solr的out of memory是自始至终困扰的问题,貌似现在有好多做solr二次开发的
2 楼 tianhendi 2008-04-18  
呵呵 现在弄好了没有呢?!
1 楼 lyo 2008-03-21  
up...

相关推荐

    solr 分布式参考

    **一、Solr分布式架构** 1. **SolrCloud模式**: Solr的分布式特性主要体现在SolrCloud模式中,这是一个基于Zookeeper协调的集群解决方案。每个Solr实例被称为一个Solr节点,多个节点组成了SolrCloud。Zookeeper用于...

    Solr 学习笔记(五)-Solr扩展之分布式索引实例

    在本篇Solr学习笔记中,我们将探讨Solr的分布式索引功能,这对于处理大量数据和实现高可用性至关重要。Solr的分布式索引能力允许我们跨越多个节点分布和处理索引过程,从而提高索引速度和查询性能。在实际应用中,这...

    solr 分布式部署

    Solr分布式部署的目标主要有两个: 1. **主辅服务器同步**:确保每当客户端对索引进行COMMIT操作时,更新能够及时地应用到辅助服务器上。这提供了高可用性和数据一致性,即使主服务器出现问题,辅助服务器也能无缝...

    基于Hadoop和HBase的分布式索引模型的研究.pdf

    该模型首先利用Solr分布式索引器生成索引文件。Solr作为一个开源的搜索服务器,基于Java开发,提供了分布式索引、搜索和高可用的集群功能。接着,利用Hadoop分布式集群进行数据处理和存储,Hadoop集群由多台计算机...

    分布式索引系统配置文件<设想一>

    常见的分布式索引系统有Elasticsearch、Hadoop HBase、Apache Solr等。这些系统通常采用分片(Sharding)和副本(Replicas)策略来确保数据的可用性和高并发性能。 配置文件是任何复杂系统的核心部分,它定义了系统...

    solr创建索引的原理及解析

    ### Solr创建索引的原理及解析 #### 一、Solr概述与索引机制 Apache Solr是一款基于Lucene的高性能全文检索服务器,广泛应用于网站的搜索功能中。Solr支持分布式部署,并且提供了丰富的API接口,方便与其他系统...

    56 solrCloud分布式搜索与索引过程

    ### 56 solrCloud分布式搜索与索引过程 #### 知识点一:SolrCloud简介 在深入了解SolrCloud的分布式搜索与索引过程之前,我们需要对SolrCloud有一个基本的认识。SolrCloud是Apache Solr的一个扩展模块,它提供了一...

    应用分布式索引提高海量数据查询性能.pdf

    文章主要探讨了在电信领域精准化营销和即席查询业务中,如何应对海量数据查询的性能挑战,并着重介绍了一种新型处理模式——应用分布式索引层来提高查询性能。 首先,文章指出在传统的处理模式中,直接对数据库进行...

    基于solr的网站索引架构(一)

    Solr是由Apache Lucene项目维护的搜索平台,其核心功能包括文本分析、索引和搜索,以及结果排序和高亮显示。它支持多种数据源,如文件、数据库等,并提供了RESTful API,便于集成到各种Web应用程序中。 2. **索引...

    Solr集群搭建,Solr提供的分布式搜索方案

    ### Solr集群搭建与SolrCloud分布式搜索方案详解 #### 一、SolrCloud概述 SolrCloud 是 Apache Solr 提供的一种分布式搜索解决方案。它主要用于处理大规模数据集的索引和检索工作,并具备容错性和分布式特性。当...

    使用MySQL作为SOLR的索引源

    SOLR利用倒排索引技术,能实现毫秒级的全文搜索,且支持分布式部署,适合大数据量的场景。 将MySQL作为SOLR的索引源,首先需要配置数据源连接。在SOLR中,这通常通过DataImportHandler (DIH) 实现,这是一个内建的...

    基于Solr的分布式铁路科技资源整合与检索实践.pdf

    Solr是一个高性能的搜索服务器,它基于Apache Lucene构建,提供了分布式索引、搜索、排名等功能,广泛应用于企业级搜索解决方案中。文中提到,为了解决铁路科技信用与能力评价中面临的问题,如科研活动信息分散、...

    Solr全文索引

    Solr全文索引是基于Apache Lucene的开源搜索服务器,它提供了一个分布式、可扩展、高性能的全文检索和分析平台。在本项目中,"Weiz.Solr"似乎是一个C#开发的Solr客户端库,用于简化与Solr服务器的交互。下面将详细...

    基于Solr的分布式全文检索系统的研究与实现.pdf

    Solr能够通过其索引处理模块,在多台计算机节点上并行创建索引,显著提升了索引的构建速度,这对于分布式全文检索系统至关重要。 分布式设计是提高系统检索性能的关键所在。本文提出了使用Zookeeper来管理集群的...

    SOLR搭建企业搜索平台

    **SOLR搭建企业搜索平台** Apache Solr是一款强大的开源企业级全文搜索引擎,它基于Java且构建于Apache Lucene之上。Solr提供了高效、可扩展的搜索和导航功能,广泛应用于各种规模的企业环境中,用于处理大量数据的...

    Window与Linux下搭建SolrCloud分布式集群环境

    Window与Linux下搭建SolrCloud分布式集群环境 Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口。用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以...

    高性能分布式搜索引擎Solr的研究与实现.pdf

    在Solr分布式搜索引擎架构中,Zookeeper可以管理集群的状态,协调不同节点的工作,保持索引的一致性和同步。 Mongodb是一个高性能的NoSQL数据库,它支持分布式文件存储。在本文中,SolrCloud(Solr的分布式实现)与...

    ZooKeeper实例 + Solr(tomcat)集群部署

    ZooKeeper作为分布式协调服务,提供了高可用性以及一致性保证,而Solr则是一款高性能、可扩展的全文搜索引擎。将二者结合,可以构建出一个稳定、高效的企业级搜索解决方案。本文旨在详细介绍如何在两台CentOS 6.3 x...

    hbase+solr创建二级索引完整操作

    ### hbase+solr创建二级索引完整操作 #### 一、概述 本文档详细介绍了如何利用HBase和Solr创建二级索引的过程。通过整合HBase与Solr的优势,可以构建高性能的数据存储与检索系统。HBase作为分布式列族数据库,能够...

Global site tag (gtag.js) - Google Analytics