0 0

Solr 大量数据时FieldCache溢出10

最近Solr索引变大后,主要是取消了每次dataimport的optimize之后,dataimport速度快了很多,但就频繁溢出了,启动一次坚持不到24小时。

 

一般是在autoWarm环节溢出的。

 

配置:

Windows Server2008 64位,内存16G,分配给Tomcat -xms=2500m -xmx4500m ,tomcat下只有Solr一个应用。

 

索引内核: 一个,optimize后有7.6G,未optimize前有15G

 

dataimport 情况:每十分钟启动一次dataimport,每次平均800条。1500字x2字节=3000字节每条。optimize=true时,平均要25分钟才完成,取消optimize后平均3分钟完成。

 

索引配置:

 

id, slong, sort,indexed,stored,

 

type,text(10) indexed,

title,text(50)indexed,

abstract,text(1000)indexed

time,datetime,indexed

 

取消了所有term相关属性和omitNorms=true

 

searcher的autoWarmCount设为1,所有cache也设到50以内。

 

查询只用了id排序。

 

目前还是这个FieldCache溢出,见图片附件。

 

 

大意是说FieldCache占了大量空间溢出了。

 

Google上说可能是因为Sort排序集太大所致。

 

除了加内存有什么好办法?

 

求众位天神施救

 

 

 

 

 

 

2011年12月23日 10:56
  • 大小: 119.9 KB
目前还没有答案

相关推荐

    solr测试数据,数据文件

    solr测试数据,数据文件

    solr 数据迁移工具

    使用多线程方式 通过solrj 接口向solr新增索引信息

    solr 全量数据迁移

    Solr,全称为Apache Solr,是一款开源的企业级搜索引擎,被广泛用于大数据处理中的全文检索、数据分析和实时搜索。在日常运维中,我们有时需要进行Solr的数据迁移,以适应系统扩展、升级或备份恢复的需求。本文将...

    solr安装数据源导入配置步骤

    安装配置solr步骤,包含oracle数据源导入数据配置,以及一些可能遇到的坑

    Solr定时更新Solr定时更新

    它在处理大量数据和提供高效搜索性能方面表现出色。而定时更新功能是Solr的一个重要特性,它允许用户定期地、自动地从数据源导入新数据或者更新已有数据,以保持索引与实际数据的一致性。 在Solr中,定时更新主要...

    solr配置中文解析器和将数据导入solr索引库时所需的jar包

    在处理中文数据时,由于中文的复杂性,需要特别配置中文解析器以正确地分词和理解文本内容。本篇文章将深入探讨如何在Solr中配置中文解析器以及在导入数据到Solr索引库时所需关注的jar包。 首先,让我们来了解Solr...

    solr5.3.1 导入mysql数据

    Solr 5.3.1 是 Apache Solr 的一个版本,它是一个开源的搜索平台,广泛用于企业级的全文检索、数据分析和分布式搜索。Solr 基于 Lucene 库,提供了高度可配置和可扩展的搜索服务。在本案例中,我们将探讨如何将 ...

    Hbase同步数据到Solr的方案

    HBase 和 Solr 都是大数据处理中的关键组件。HBase 是一个分布式的、面向列的NoSQL数据库,适合存储大规模结构化数据。而Solr 是一个流行的全文搜索引擎,提供高效的全文检索、命中高亮、拼写检查等特性。将HBase的...

    solr服务器_solr_

    6. **分布式搜索**:Solr支持分布式搜索,这意味着可以在多台服务器上部署Solr,并将索引分布在这些服务器上,以处理大量数据和高并发请求。SolrCloud是Solr的分布式实现,它利用ZooKeeper进行集群协调和配置管理。 ...

    Solr数据库插入(全量和增量)索引

    Solr 是一个基于 Lucene 的搜索引擎,可以快速高效地对大量数据进行索引和查询。在实际应用中,我们需要将数据插入 Solr 索引库中,以便实现高效的搜索功能。本文将详细介绍 Solr 数据库插入全量和增量索引的方法和...

    solr(solr-9.0.0.tgz)

    总的来说,Solr-9.0.0是一个强大且灵活的搜索平台,适用于需要大量数据搜索和分析的场景,如电商网站的商品搜索、新闻网站的内容检索、企业内部的文档搜索等。通过深入理解和熟练使用Solr,你可以为你的应用程序提供...

    solr-dataimport-scheduler.jar 可使用于solr7.x版本

    Solr能够对大量数据进行快速的全文检索,同时支持多字段排序、分面搜索和自定义评分策略。为了保持索引与源数据的一致性,Solr引入了DIH,这是一个内建的机制,用于从关系数据库、XML文件等外部数据源导入数据,并将...

    solr定时同步jar包.zip

    全量导入会将整个数据源的数据导入到Solr索引中,而增量导入则仅导入自上次导入以来发生变更的数据,这在处理大量数据时尤其有用,因为它减少了不必要的资源消耗。 在这个特定的jar包——"solr-dataimportscheduler...

    solr增量更新架包apache-solr-dataimportscheduler.jar

    这通常在系统初始化或者数据大幅度变动时进行。 2. **增量导入**:增量导入只导入自上次导入以来发生变化的数据。Solr通过跟踪数据源中的“lastModified”或者其他时间戳字段来识别新数据或已修改的数据。这样可以...

    Solr项目源码及solr资源包

    它支持多种数据源,可以处理大量结构化和非结构化数据,提供快速的全文搜索、近实时搜索、富文本处理、地理位置搜索等功能。 2. **Spring Data Solr**:Spring Data Solr是Spring框架的一个模块,它简化了与Solr...

    solr-dataimportscheduler-1.4.jar 增量定时同步数据到solr.rar

    它能够高效、快速地处理大量文本数据,并提供全文检索、 faceted search(分面搜索)、hit highlighting(高亮显示搜索结果)等多种功能。在企业级应用中,Solr通常用于构建强大的搜索解决方案。 本压缩包“solr-...

    Dubbo+Solr+RabbitMQ实现Solr数据同步 DataSyncParent.zip

    在本项目中,Solr作为数据的存储和检索平台,用于快速查询大量数据。 1. **索引构建**:Solr允许开发者定义自己的索引模型,支持多种类型的字段,如文本、数字、日期等,并能对字段进行分词、分析。 2. **分布式...

    solr定时自动同步数据库需要用到的apache-solr-dataimportscheduler.jar包

    Apache Solr是一款强大的开源搜索引擎,它能够高效地处理和索引大量数据,提供快速的全文检索、 faceting、高亮显示等高级功能。在实际应用中,为了保持搜索结果的实时性,我们往往需要将数据库中的数据实时或定时...

    solr4.9开发所需jar包

    在Solr4.9中,DIH可以帮助开发者轻松地将大量数据导入到Solr中进行搜索,这对于需要实时或定期更新索引的应用来说尤其重要。 在开发Solr4.9时,开发者需要了解以下关键知识点: 1. **Solr核心概念**:如集合...

Global site tag (gtag.js) - Google Analytics