基于Lucene的SOLR一直以稳定、高性能著称,虽然其在高并发下对CPU要求较高,但能解决复杂的查询并能以如此快的速度内返回搜索结果,实在是开发搜索的一大利器。公司部署在Linux服务器上的Master-Slave架构的SOLR在过去1年多以来运行都比较稳定。
最近一周,有开发人员反馈索引更新速度非常慢,造成一大堆数据还未等待索引操作,客户端提交索引的逻辑优化很多遍都没有效果。对于索引性能的检查,主要是从客户端和服务端两个地方入手:
1、客户端,检查结果发现多线程并未出现死锁,通过solrj发送索引命令因为执行速度太慢一直被阻塞在线程池中,客户端使用的是官方推荐的ConcurrentUpdateSolrServer,采用批量adds的方式更新索引(平均每秒需要更新3万条),使用效率更高的二进制请求(替换XML请求);客户端未不是问题的根源。
2、服务端,IO压力不大,内存充裕,CPU占用率偏高达到40%以上;查看solr日志发现大量出现adds 300条索引的时间QTime达到惊人的几十秒;索引瓶颈出现在服务端。
于是安排开发人员分析是否因为随着数据量的上升(1.3亿条索引数据、占用磁盘空间50G左右),而带来的索引压力大造成速度被拖垮?通过调整solrconfig.xml的一系列参数,如增大ramBufferSizeMB,加大mergeFactor,减少autoCommit次数,尽量减少磁盘操作,测试索引速度,但收效甚微。通过GC日志分析垃圾回收正常,即使更换垃圾回收策略也没有明显的提升空间。
最后只能去dump线程分析CPU花费在哪些上面,在dump日志中看到tomcat的很多线程都处于等待状态,处于Running状态的经常是分词,于是把堆栈拷贝出来给分词器开发人员分析,开发人员从堆栈中看出代码执行在简繁体转换,在快速修复分词器的这个bug后更新到SOLR服务器,索引速度恢复如初。
相关推荐
虽然给定的部分内容中没有提及具体的Solr调优方法,但在实际应用中,Solr的性能优化可以从以下几个方面着手: 1. **索引结构优化**:合理设计索引结构,包括字段类型、分词器的选择等。 2. **查询优化**:使用高效...
SOLR 检索调优
solr同步调优,达到15分钟处理10万条数据更新,大约20万次solr操作(删除和插入),失败率1/10万
在本文中,我们将探讨如何在 Linux 环境下部署、维护和调优 Solr 4.4 版本。 首先,为了运行 Solr,我们需要先安装 Java 开发工具包(JDK)。这里我们选择了 JDK 1.7。使用 rpm 命令安装 JDK 1.7,并通过编辑 `/etc...
"solr性能调优.mht"文件专门针对Solr的性能优化,包括索引优化、硬件配置、查询策略调整等方面,对于追求高效稳定运行的Solr系统来说,这部分内容是必不可少的。 这些文档和资料覆盖了Solr的多个方面,包括入门、...
**六、Solr性能调优** 6.1 Schema Design Considerations 6.2 Configuration Considerations 6.3 Cache autoWarm Count Considerations 6.4 Cache hit rate 6.5 Explicit Warming of Sort Fields 6.6 Optimization ...
7. **监控与性能调优**:Solr提供了丰富的监控指标,如JMX接口,可以通过监控工具(如JConsole)观察Solr的内存使用、线程状态等。根据监控结果进行性能调优,如调整JVM参数、索引分片策略等。 8. **安全与集群**:...
- **性能调优**:根据实际数据量和查询需求调整 IK 分词器的配置参数,如缓存大小、最大扩展词长度等。 - **分词结果的精度**:观察并评估分词结果,对特定领域可能需要自定义词典以提高分词的准确性。 - **多语言...
### Solr教材知识点详解 ...以上是关于《solr教材-PDF版》的详细知识点介绍,涵盖了从Solr的基本概念到具体应用场景,再到性能调优等多个方面,旨在帮助读者全面了解和掌握Solr的核心技术和最佳实践。
6. **测试与调优**:通过Solr的Admin UI或者使用命令行工具,可以测试分词效果并根据反馈进行优化。 总之,"solr7.2.1 ik"这个压缩包为用户提供了Solr 7.2.1版本与IK分词器的集成,简化了搭建过程,方便开发者快速...
性能调优是Solr使用中的重要环节。这涉及到Schema设计(如哪些字段应被索引,哪些应被存储),配置优化(mergeFactor、缓存设置等),内存管理(防止内存溢出,合理分配JVM内存),以及更新频率和查询响应压缩等方面...
《mmseg4j在Solr中的...通过合理的配置和调优,我们可以充分利用mmseg4j的优势,提升Solr系统的整体性能。在实际项目中,结合Solr的其他特性,如 faceting、spell checking等,可以构建出高效、智能的全文搜索引擎。
- **集群调优**:根据负载动态调整节点数量和分布。 7. **社区支持**: 作为Apache软件基金会项目,Solr拥有活跃的开发者社区,不断提供新功能和改进,以及丰富的文档和示例代码供学习参考。 综上所述,Solr ...
3. **性能调优**: 提供针对不同场景下的性能优化建议和技术细节。 4. **高级特性**: 如复制、分片、云模式等高级功能的实现原理和配置方法。 5. **安全性**: 讨论 Solr 的安全性和认证/授权机制。 #### 九、案例...
8. **性能调优**: - 调整内存分配、并发设置、索引缓存策略等,以优化Solr的性能。 - 分析和监控Solr的日志和JVM指标,以便找出性能瓶颈。 9. **安全考虑**: - 需要配置Solr的安全组件,如Solr Security ...
从安装、创建核心到索引数据、查询优化,每个环节都有详细的配置和调优策略。了解并掌握 Solr 的使用,能够帮助开发者构建出满足业务需求的高效检索系统。在实际操作中,应结合具体场景和需求,灵活运用 Solr 的各种...
根据实际情况进行调优,例如调整缓存大小、增加硬件资源等。 10. **扩展与维护**:Solr支持多种插件,如高亮显示、拼音分析等,可以根据业务需求进行扩展。同时,定期更新到最新版本以获取安全补丁和新特性。 综上...
Solr,全称为Apache Solr,是Apache软件基金会的一个开源项目,主要被设计用来实现高效、可扩展的全文检索服务。...在实际应用中,需要根据具体业务需求进行详细配置和调优,以充分发挥Solr的潜力。
同时,性能分析和调优也是维护工作的一部分,这涉及到内存设置、硬件配置和网络优化。 10. **日志与监控**:Solr提供了丰富的日志信息,配合监控工具(如JMX、Prometheus、Grafana等),可以实时监控系统状态,及时...