索引建立的性能因素
1)参数mergeFactor 表明索引段合并时所具有索引段的数量,即索引段合并的频率。
该值越大,则索引合并频率越低,索引建立的速度快。反之将造成建立索引的开销加大。但
是值得注意的是如果配置过大,容易出现表中mergeFactor=100 时的极端情形,索引文件成
级数量增长而不会合并造成了系统打开文件数量过大,系统资源消耗殆尽,处理效率极其低
下。在实际应用中,如果索引是增量式发展,建议配置为较小值如10。如果索引一般是批
量加载,那么应该根据系统实际情况配置成适当大的值如50,还应该考虑具体的内存配置
大小来调整相应的大小。
2)参数maxBufferedDocs 定义了触发文档合并动作并建立一个新索引段的最小文档数
量。尚未达到该数量的索引文档将在内存中操作,一旦达到配置的数量,这些文档将合并
成一个索引段写入磁盘。从测试可以看出该值越大系统每次I/O 以及buffer 的占用都将加大,
说明内存中操作的数据量增多,但是如果内存较小,过大的配置值也会适得其反,内存占用
过多。总的来说,如果内存是主要考虑因素的话就应该将该值控制在100 的量级上,如果内
存较大,就可以把该配置适当调高到1000 的量级上,让更多的记录在内存中操作。
信息检索的性能因素
1) Solrconfig.xml 中参数enableLazyFieldLoading:该配置项决定是否启用检索时的懒
散加载功能。所谓懒散加载是指,搜索引擎在返回检索结果的时候不会一次加载整个文档
中存贮的信息,这在文档较大的情况下能大大的缩减检索的开销。如果系统的用户第一次点
击看到的只是部分信息,那么可以将该配置项设置为true。如果项目要求用户检索的结构要
显示全部文档信息,并且记录长度较大无法一次读取加载时,就不能开启该选项。
2) Solrconfig.xml 中参数cache:SOLR 与Cache 相关的配置项可以配置Cache 策略的
实现类,Cache 最大条目,Cache 初始大小,autoWarmCount 决定取自旧缓存以预热新缓存
的条目数。如果autoWarmCount 配置较大就会提高缓存命中率,但同时预热的开销就会加
大,反之则预热简单,命中率也会降低,通常配置为初始大小的一半。
分享到:
相关推荐
- 类似地,当Solr使用HDFS作为底层存储时,也需要注意HDFS的性能调优,以保证数据访问的高效性。 #### 12.9 Spark ##### 12.9.1 Spark Core调优 - Spark Core的调优主要涉及以下方面: - **数据序列化**: 选择...
"solr性能调优.mht"文件专门针对Solr的性能优化,包括索引优化、硬件配置、查询策略调整等方面,对于追求高效稳定运行的Solr系统来说,这部分内容是必不可少的。 这些文档和资料覆盖了Solr的多个方面,包括入门、...
MySQL的性能调优主要集中在参数配置方面,以下是一些重要的配置项: - **开启慢查询日志**:通过设置`slow_query_log`为1来开启慢查询日志记录功能,并指定慢查询日志文件路径。 - **设置缓冲池大小**:`innodb_...
**六、Solr性能调优** 6.1 Schema Design Considerations 6.2 Configuration Considerations 6.3 Cache autoWarm Count Considerations 6.4 Cache hit rate 6.5 Explicit Warming of Sort Fields 6.6 Optimization ...
6. Solr性能调优 - Schema设计考量:讨论了在设计Schema时,如何考虑索引字段和存储字段。 - 配置考量:介绍了合并因子、缓存自动预热计数、缓存命中率、字段排序的显式预热、查询响应压缩等方面的性能调优技巧。 - ...
本书是针对那些希望深入了解Solr性能调优的读者,尤其是那些在日常工作中遇到搜索性能瓶颈并寻求解决方案的开发者。 由于这本书是用英文编写的,并且是完整版,它可能包含以下知识点: 1. Solr的工作原理:介绍...
#### 六、solr性能调优 - **6.1 SchemaDesignConsiderations** - **6.1.1 indexedfields**:索引字段的设置对性能有直接影响。 - **6.1.2 storedfields**:存储字段的选择会影响搜索结果的返回速度。 - **6.2 ...
#### 六、solr性能调优 - **6.1 Schema Design Considerations** - **6.1.1 indexed fields**:讨论索引字段的选择和设计。 - **6.1.2 stored fields**:解释存储字段的重要性及其对性能的影响。 - **6.2 ...
#### solr性能调优 - **SchemaDesignConsiderations**:合理设计字段类型和索引结构,避免不必要的字段存储和索引,可以显著提高性能。 - **ConfigurationConsiderations**:调整Solr的配置参数,如合并因子...
#### 六、solr性能调优 **6.1 Schema Design Considerations** - **6.1.1 indexed fields** 索引字段的选择直接影响到搜索性能。 - **6.1.2 stored fields** 存储字段的选择影响数据的存储空间。 **6.2 ...
Solr 性能调优 为了进一步提升 Solr 的性能,架构师和技术团队需要对索引结构、查询逻辑等方面进行细致的优化。例如,可以通过调整索引分片的数量、使用更高效的编码方式等手段来提高索引效率和查询速度。 ### 三...
在本文中,我们将探讨如何在 Linux 环境下部署、维护和调优 Solr 4.4 版本。 首先,为了运行 Solr,我们需要先安装 Java 开发工具包(JDK)。这里我们选择了 JDK 1.7。使用 rpm 命令安装 JDK 1.7,并通过编辑 `/etc...
#### 六、Solr性能调优 - **6.1 Schema Design Considerations**:设计高效的Schema结构。 - **6.1.1 indexed fields**:哪些字段需要被索引。 - **6.1.2 stored fields**:哪些字段需要被存储。 - **6.2 ...
性能调优是Solr使用中的重要环节。这涉及到Schema设计(如哪些字段应被索引,哪些应被存储),配置优化(mergeFactor、缓存设置等),内存管理(防止内存溢出,合理分配JVM内存),以及更新频率和查询响应压缩等方面...
### Solr性能优化关键知识点详解 #### 一、理解Solr环境与版本 - **环境配置**:在本文档中,我们关注的是基于Tomcat 6的Solr 3.5版本的部署与优化,这对于初学者来说是一个非常实用且稳定的组合。 - **Solr简介...
7. **监控与性能调优**:Solr提供了丰富的监控指标,如JMX接口,可以通过监控工具(如JConsole)观察Solr的内存使用、线程状态等。根据监控结果进行性能调优,如调整JVM参数、索引分片策略等。 8. **安全与集群**:...