`

SolrCloud/ZooKeeper优化

    博客分类:
  • solr
 
阅读更多

SolrCloud优化:

 

1:CPU主频

2:ZooKeeper的优化项: 参考:http://zookeeper.apache.org/doc/trunk/zookeeperAdmin.html

Things to Avoid

Here are some common problems you can avoid by configuring ZooKeeper correctly:

inconsistent lists of servers

The list of ZooKeeper servers used by the clients must match the list of ZooKeeper servers that each ZooKeeper server has. Things work okay if the client list is a subset of the real list, but things will really act strange if clients have a list of ZooKeeper servers that are in different ZooKeeper clusters. Also, the server lists in each Zookeeper server configuration file should be consistent with one another.

incorrect placement of transasction log

The most performance critical part of ZooKeeper is the transaction log. ZooKeeper syncs transactions to media before it returns a response. A dedicated transaction log device is key to consistent good performance. Putting the log on a busy device will adversely effect performance. If you only have one storage device, put trace files on NFS and increase the snapshotCount; it doesn't eliminate the problem, but it should mitigate it.

incorrect Java heap size

You should take special care to set your Java max heap size correctly. In particular, you should not create a situation in which ZooKeeper swaps to disk. The disk is death to ZooKeeper. Everything is ordered, so if processing one request swaps the disk, all other queued requests will probably do the same. the disk. DON'T SWAP.

Be conservative in your estimates: if you have 4G of RAM, do not set the Java max heap size to 6G or even 4G. For example, it is more likely you would use a 3G heap for a 4G machine, as the operating system and the cache also need memory. The best and only recommend practice for estimating the heap size your system needs is to run load tests, and then make sure you are well below the usage limit that would cause the system to swap.

 

 

3:

每指定个maxBufferedDocs 为一个 segment ,每指定个mergeFactor 为一个single index file,适当调整maxBufferedDocs 和 mergeFactor 参数以致优化

 

4:点击solr admin UI 中的 Optimize 按钮,会将 single index file 合成一个索引文件, Optimize 是一个I/O高密集形任务,且 solr数据频繁的更新也会导致 Optimize 后的索引使用不了多长时间就得重新 Optimize ;

 

5: 参考:http://www.solr.cc/blog/?p=788

1、数据更新频率:每天数据增量有多大,随时更新还是定时更新
2、数据总量:数据要保存多长时间
3、一致性要求:期望多长时间内看到更新的数据,最长允许多长时间延迟
4、数据特点:数据源包括哪些,平均单条记录大小
5、业务特点:有哪些排序要求,检索条件
6、资源复用:已有的硬件配置是怎样的,是否有升级计划

 

分享到:
评论

相关推荐

    solrcloud分布式集群部署zookeeper集群安装+ClientCRUD实例

    SolrCloud是Apache Solr的一个分布式搜索和分析平台,它利用Zookeeper进行集群管理和协调。在本教程中,我们将深入探讨如何部署一个SolrCloud...通过实践和持续学习,您可以更好地掌握SolrCloud的高级特性和优化策略。

    SolrCloud集群搭建和使用步骤

    在传统的Solr基础上,SolrCloud引入了ZooKeeper作为集群的配置信息中心,实现了分布式索引和检索的高效管理。 1. **ZooKeeper的角色与功能** - **配置管理**:ZooKeeper作为一个分布式协调服务,可以集中管理配置...

    SolrCloud集群部署

    总之,SolrCloud结合Zookeeper,提供了强大且可靠的分布式搜索解决方案,适应大规模、高并发的场景,同时通过自动化管理和故障恢复机制,降低了运维复杂度。对于初学者而言,理解和掌握SolrCloud的部署和运作原理,...

    solrcloud.rar

    SolrCloud是Apache Solr的一种分布式搜索和索引服务模式,它允许用户在多台服务器上部署和管理Solr实例,形成...在实际操作中,我们需要深入了解这两个组件的工作原理和配置方法,以便更好地管理和优化SolrCloud集群。

    集群搭建(zookeeper集群+solr集群)

    SolrCloud基于Solr和Zookeeper构建,其中Zookeeper作为集群的配置信息中心。该方案具有以下几个核心特点: 1. **集中式的配置信息**:所有节点共享相同的配置,便于管理和更新。 2. **自动容错**:能够自动检测和...

    solrcloud 高可用集群搭建

    使用Solr提供的管理界面或Zookeeper的监控工具,可以观察集群的状态、分片分布、节点健康状况等信息,以进行必要的调整和优化。 总之,SolrCloud高可用集群的搭建涉及多个步骤,包括环境准备、组件安装、配置调整...

    Tomcat+solrcloud6.2整合Web项目

    SolrCloud通过ZooKeeper进行集群管理,ZooKeeper负责存储配置信息,协调节点间的通信以及处理故障转移。在我们的项目中,"zookeeper-3.4.6.jar"是ZooKeeper的依赖库,它的存在确保了集群的稳定运行。 接着,我们...

    zookeeper-solr集群

    在本场景中,我们主要关注如何在Linux环境下搭建一个基于Zookeeper的SolrCloud集群。 首先,我们需要准备必要的软件环境。操作系统选择的是Linux,而Solr服务使用的是版本4.8.1,与之配合的Tomcat服务器是7.0.54...

    solr_v440_5001+zookeeper2181

    SolrCloud是Apache Solr的一种分布式搜索和索引服务模式,它基于ZooKeeper进行集群管理和协调。在本文中,我们将深入探讨如何部署SolrCloud,并了解相关的技术背景。 Solr,作为Apache Lucene的一个子项目,是一款...

    solrcloud6安装配置

    同时,对索引优化、查询性能调优也是提升SolrCloud性能的关键环节。 总的来说,SolrCloud 6的安装配置涉及到多个步骤,包括下载安装、集群启动、创建Collections、配置分词器以及导入数据。理解并掌握这些流程,将...

    solr-zookeeper-tomcat集群搭建

    `<solrcloud>`标签内,设置`zkHost`属性为Zookeeper集群地址。 2. 分别启动每个Solr实例,通过命令行或启动脚本运行: ``` cd /opt/solr/myinstance bin/solr start -p 8983 -e cloud -z localhost:2181 ``` ...

    zookeeper 集群搭建1

    通过以上步骤,我们可以成功地搭建一个Zookeeper集群和SolrCloud,确保服务的高可用性和数据的分散存储,为大数据环境下的搜索和分析提供强大支持。在实际应用中,还需要关注监控、日志管理以及性能优化等方面,以...

    Linux安装集群版Solr.docx

    Linux安装集群版Solr涉及到的关键知识点是SolrCloud、Zookeeper以及它们在分布式搜索和集群管理中的作用。首先,SolrCloud是Apache Solr提供的一个分布式解决方案,它旨在处理大规模的索引数据,同时具备高并发搜索...

    solr集群安装部署

    Zookeeper是SolrCloud(Solr的集群模式)的核心组件,用于协调节点间的通信和状态管理。你需要在至少三个不同的服务器上部署Zookeeper实例,以实现容错。配置Zookeeper配置文件`conf/zoo.cfg`,包括`dataDir`(存储...

    solr4.9+tomcat+zookeeper集群

    4. **配置SolrCloud**: 更新solrconfig.xml和schema.xml文件,启用Cloud模式,并配置Zookeeper连接信息。 5. **启动Solr和Zookeeper**: 启动所有节点的Tomcat和Zookeeper服务。 6. **创建并分发索引**: 在Zookeeper...

    Solr4+SolrCloud安装使用手册和详细说明,参考官方文档整理.

    SolrCloud 是 Solr 的分布式版本,提供高可用性和数据分区,通过 ZooKeeper 进行集群管理和协调。以下是对 SolrCloud 安装和使用进行的详细说明。 ### SolrCloud 安装步骤 1. **解压和部署**:首先,你需要解压缩 ...

    Solr初体验

    SolrCloud 使用 ZooKeeper 进行集群状态的管理和协调,确保数据的一致性和可用性。 5.2 分片与复制 数据在 SolrCloud 中被分片存储,副本可以在节点间复制,提高容错性和负载均衡。 5.3 聚合操作 通过分布式聚合...

    solr 分布式参考

    3. **网络优化**: 减少网络延迟,如采用高性能的网络设备,优化Zookeeper配置。 4. **配置调整**: 调整SolrCloud的配置参数,如分片大小、副本数量、请求超时时间等,以适应不同业务需求。 5. **监控和故障恢复**:...

    高性能分布式搜索引擎Solr的研究与实现.pdf

    关键词包括:Solr、SolrCloud、Zookeeper、Mongodb。这些关键词指向了构建高性能分布式搜索引擎所需的各个关键组件和概念。 Solr是一个开源的搜索引擎,它是基于Java语言开发的全文搜索引擎库Lucene构建的。Solr...

Global site tag (gtag.js) - Google Analytics