`

solr solrconfig.xml

    博客分类:
  • solr
 
阅读更多

 

 

一.    DataDir 参数

 

      <dataDir>/var/data/solr</dataDir>

       不用 “Solr home”/data 目录,可以指定其它别的目录来存放所有索引数据。如果使用了 replication(主从复制),它可以匹配 replication 配置。如果这个目录不是绝对的,那会是当前 servlet 容器工作目录下的相对目录。

 

 

 

二.    mainIndex

       这些值用来控制合并多个索引段 <mainIndex>

    <!-- lucene options specific to the main on-disk lucene index -->
    <useCompoundFile>false</useCompoundFile>
    <mergeFactor>10</mergeFactor>
    <maxBufferedDocs>1000</maxBufferedDocs>
    <maxMergeDocs>2147483647</maxMergeDocs>
    <maxFieldLength>10000</maxFieldLength>
  </mainIndex>

 

       1.   <useCompoundFile>

                 通过将很多 Lucene 内部文件整合到单一一个文件来减少使用中的文件的数量。

                这可有助于减少 Solr 使用的文件句柄数目,代价是降低了性能。

                除非是应用程序用完了文件句柄,否则 false 的默认值应该就已经足够。  

 

           2.   mergeFactor

                 决定低水平的 Lucene 段被合并的频率。较小的值(最小为  2 )使用的内存较少但导致的索引时间也更慢。

                 较大的值可使索引时间变快但会牺牲较多的内存。    

 

         3.  maxBufferedDocs

                  在合并内存中文档和创建新段之前,定义所需索引的最小文档数。

                  段是用来存储索引信息的 Lucene 文件。较大的值可使索引时间变快但会牺牲较多的内存。    

 

             4.   maxMergeDocs

                   控制可由 Solr 最适合于具有合并的 Document 的最大数。

                  较小的值 (<  10 大量更新的应用程序。

                 该参数不允许lucene在任何索引段里包含比这个值更多的文档,

                  但是,多余的文档可以创建一个新的索引段进行替换。

   

             5.    maxFieldLength:  

                    对于给定的 Document,控制可添加到 Field 的最大条目数,进而截断该文档。

                    如果文档可能会很大,就需要增加这个数值。然而,若将这个值设置得过高会导致内存不足错误。 

 

 

  6.   unlockOnStartup

              unlockOnStartup 告知 Solr 忽略在多线程环境中用来保护索引的锁定机制。

                在某些情况下,索引可能会由于不正确的关机或其他错误而一直处于锁定,这就妨碍了添加和更新。

                将其设置为 true 可以禁用启动锁定,进而允许进行添加和更新。

 

 

三   高亮插件配置

 

 

  <highlighting>
   <!-- Configure the standard fragmenter -->
   <!-- This could most likely be commented out in the "default" case -->
   <fragmenter name="gap" class="org.apache.solr.highlight.GapFragmenter" default="true">
    <lst name="defaults">
     <int name="hl.fragsize">100</int>
    </lst>
   </fragmenter>
 
   <!-- A regular-expression-based fragmenter (f.i., for sentence extraction) -->
   <fragmenter name="regex" class="org.apache.solr.highlight.RegexFragmenter">
    <lst name="defaults">
      <!-- slightly smaller fragsizes work better because of slop -->
      <int name="hl.fragsize">70</int>
      <!-- allow 50% slop on fragment sizes -->
      <float name="hl.regex.slop">0.5</float> 
      <!-- a basic sentence pattern -->
      <str name="hl.regex.pattern">[-\w ,/\n\"']{20,200}</str>
    </lst>
   </fragmenter>
 
   <!-- Configure the standard formatter -->
   <formatter name="html" class="org.apache.solr.highlight.HtmlFormatter" default="true">
    <lst name="defaults">
     <str name="hl.simple.pre"><![CDATA[<em>]]></str>
     <str name="hl.simple.post"><![CDATA[</em>]]></str>
    </lst>
   </formatter>
  </highlighting>
分享到:
评论

相关推荐

    solrconfig.xml和schema.xml说明

    Solrconfig.xml 是 Apache Solr 的核心配置文件之一,主要用于定义 Solr 实例如何处理文档的索引与查询请求。该文件中包含了多种配置项,用于定制化 Solr 的行为。 #### Solrconfig.xml 详解 **datadir 节点** - ...

    ik-analyzer-solr7.zip

    配置文件(如`schema.xml`或`solrconfig.xml`)需要更新以指示Solr使用IKAnalyzer进行分词。JAR库文件(如`ik-analyzer.jar`)则需要添加到Solr的类路径中,以便在运行时能够加载和使用分词器。字典文件通常包含预定...

    解决solr启动404问题

    Solr的核心配置文件是`solrconfig.xml`和`schema.xml`,它们定义了索引的结构和处理查询的方式。 当你遇到404错误,首先检查Solr是否成功启动。查看日志文件(通常是`logs/solr.log`)以获取更详细的错误信息。如果...

    solr-dataimport-scheduler.jar 可使用于solr7.x版本

    然后,在Solr的配置文件(如solrconfig.xml)中,你需要定义一个DIH的配置,包括数据源类型、查询语句、映射规则等。接着,设置定时任务的配置,例如定义一个cron表达式来指定数据导入的频率。 定时任务的触发可以...

    solr6.x_IK中文分词工具

    3. 修改Solr的配置文件`solrconfig.xml`,在`&lt;searcher&gt;`标签内添加IK分析器的定义: ```xml &lt;tokenizer class="org.apache.lucene.analysis.cn.smart.SmartChineseAnalyzer"/&gt; &lt;tokenizer class="org.apache....

    solr4.X所用IKAnalyzer中文分词器jar包

    3. **配置Solr**:在`solrconfig.xml`中配置分词器,指定使用IKAnalyzer,并在`schema.xml`中定义字段类型,指定该字段使用IKAnalyzer进行分词。 4. **重启Solr**:完成上述配置后,重启Solr服务器,使新的分词器...

    ikanalyzer-solr6.zip

    同时,确保Solr的配置文件(如`solrconfig.xml`)能够找到这个库。 2. **配置Analyzer**:在`solrconfig.xml`中,你需要定义一个名为“ik”的Analyzer,指定使用IKAnalyzer。这通常在`&lt;analyzer&gt;`标签内完成,设置`...

    solr schema solrconfig 配置文件解析

    Solr,作为一款开源的全文搜索引擎,其核心配置文件包括`schema.xml`和`solrconfig.xml`,它们是Solr工作方式的基础。在深入理解这两个文件之前,我们需要先了解Solr的基本架构。 **1. Solr架构简介** Solr采用...

    ikanalyzer-solr5.rar

    集成IKAnalyzer到Solr的过程中,通常需要修改Solr的配置文件,包括solrconfig.xml和schema.xml。在solrconfig.xml中,需要配置分词器的相关参数,如词典路径等;在schema.xml中,需要定义字段类型(fieldType)并...

    apache-solr-dataimportscheduler-1.0.zip_official54l_solr 5.x定时生成

    2. **添加Scheduler配置**:在Solr的配置文件`solrconfig.xml`中,你需要定义DataImportScheduler的配置,包括定时任务的频率、执行时间等。这通常涉及到`&lt;requestHandler&gt;`和`&lt;lst name="dataimport"&gt;`标签的设置。...

    Apache Solr(solr-8.11.1.zip)

    `solrconfig.xml`定义了Solr实例的行为,包括搜索处理流程、缓存策略和更新处理。`schema.xml`(在较新版本中为managed schema)用于定义字段类型和字段,以及文档结构。 5. **请求处理器**:Solr提供多种请求...

    ikanalyzer-solr7.7.2.zip

    接下来,将ikanalyzer集成到Solr中,这通常涉及到修改Solr的配置文件如`solrconfig.xml`和`schema.xml`,引入ikanalyzer的jar包,如`ik-analyzer-solr5-5.x.jar`和`solr-analyzer-ik-5.1.0.jar`。同时,还需要配置IK...

    Solr 样例应用程序:j-solr1.zip

    1. **配置文件**:在Solr中,配置文件位于`conf`目录下,包括`schema.xml`(定义字段和索引规则)、`solrconfig.xml`(配置索引和查询行为)等,它们是定制Solr核心行为的关键。 2. **索引目录**:索引文件通常存储...

    最新版windows solr-8.9.0.zip

    - **solrconfig.xml**:这是Solr实例的主要配置文件,定义了索引处理、查询行为、请求处理器和查询解析器等设置。 - **schema.xml**:定义索引的结构,包括字段名、类型和分析器等。 4. **Windows特定优化**: -...

    solr4.9.0.zip

    3. **配置灵活**:Solr的配置文件(如solrconfig.xml和schema.xml)提供了高度自定义的能力,可以根据业务需求调整搜索策略和字段设置。 4. **分布式搜索**:Solr 4.9.0 支持分布式搜索,可以将索引分散在多台...

    apache-tomcat-8.5.45_solr.zip

    以及`solrconfig.xml`和`schema.xml`(位于Solr的`conf`目录下),用于定义Solr的索引配置和字段类型。 Solr的配置文件`solrconfig.xml`定义了索引的创建、更新和查询行为。例如,你可以配置搜索请求处理器、缓存...

    solr(solr-9.0.0.tgz)

    在使用Solr-9.0.0时,你需要根据业务需求创建或修改配置文件,如`solrconfig.xml`和`schema.xml`,定义索引的字段类型和字段。然后可以通过POST请求将数据导入Solr,Solr会自动进行分词、建立倒排索引等操作,从而...

    solr 4.10&

    - **SolrConfig.xml**:配置Solr的行为,如缓存策略、请求处理器等。 - **Admin界面**:提供Web界面用于监控和管理Solr实例,包括查看状态、提交索引、执行查询等操作。 4. **Solr与SSO集成**: 文件`ssotool....

    solr-4.10.3.tgz.tgz

    每个核心有自己的配置,如字段类型、字段配置、搜索处理链等,这些都在`conf`目录下的`schema.xml`、`solrconfig.xml`等文件中定义。 此外,Solr还支持多种数据源的接入,例如文件系统、数据库等,通过数据驱动的...

Global site tag (gtag.js) - Google Analytics