`

solr schema.xml配置总结

    博客分类:
  • solr
 
阅读更多

schema.xml 在solr/conf/目录下,类似于数据表配置文件。

 

 

为了改进性能,可以采取以下几种措施:

1.   将所有只用于搜索的,而不需要作为查询结果的field(特别是一些比较大的field)的stored设置为false。

 

2.   将不需要被用于搜索的,而只是作为查询结果返回的field的indexed设置为false。

 

3.   删除所有不必要的copyField声明,根据需要决定是否进行存储。

 

4.   为了索引字段的最小化和搜索的效率,将所有的 text fields的index都设置成false,然后使用copyField将他们都复制到一个总的 text field上,然后对他进行搜索。

 

5.   使用尽可能高的Log输出等级,减少日志量。可以在solr/admin 中的 LOGGING 进行设置。

 

 

特珠说明:

1.   高高是基于分词的,所有存储需要高亮显示的字段 一定要分词(text)才能高亮显示。

2.   排序字段 是不能当  查询过滤的条件。

 

 

 

文本主要配置项:

 

1.   field 类型定义

      重点是中文分词的添加

 

2.   field 各属性定义

      name     type类型   indexed是否建立索引  stored是否存储 required 是否必填项 multiValued多值存储

 

3.   唯一key

     <uniqueKey>id</uniqueKey>

     文档的唯一标识, 必须填写这个field(除非该field被标记required="false"),否则solr建立索引报错。

 

4.   默认搜索字段 field

     <defaultSearchField>text</defaultSearchField>

     如果搜索参数中没有指定具体的field,那么这个做为默认的域。

 

5.   搜索参数短语间逻辑

     <solrQueryParser defaultOperator="OR"/>

 

      配置搜索参数短语间的逻辑,可以是"AND|OR"。

      备注: AND是交集,OR是并集

 

6.  复制字段

     <copyField source="content" dest="text"/>

     将多个字段的值 复制至 一个字段中,如果被复制的字段都设置为stored,那个这个字段务必不要设置成stored=true

 

7.  自定义评分器

     <similarity class="......SolrSimilarity"/>

      SolrSimilarity 是继承 DefaultSimilarity的子类,或者实现评分器接口的类。

 

分享到:
评论

相关推荐

    solrconfig.xml和schema.xml说明

    ### Solrconfig.xml 和 Schema.xml 说明 #### Solrconfig.xml 概述 Solrconfig.xml 是 Apache Solr 的核心配置文件之一,主要用于定义 Solr 实例如何处理文档的索引与查询请求。该文件中包含了多种配置项,用于...

    ik-analyzer-solr7.zip

    配置文件(如`schema.xml`或`solrconfig.xml`)需要更新以指示Solr使用IKAnalyzer进行分词。JAR库文件(如`ik-analyzer.jar`)则需要添加到Solr的类路径中,以便在运行时能够加载和使用分词器。字典文件通常包含预定...

    ikanalyzer5.5-solr6.5.zip

    2. **配置Solr schema.xml**:在Solr的schema.xml配置文件中,为需要分词的字段指定`&lt;analyzer&gt;`标签,使用IKAnalyzer的类名,如`org.wltea.analyzer.lucene.IKAnalyzer`。 3. **启动Solr**:更新完配置后,重启Solr...

    ik-analyzer-solr7.x.zip

    在“server/solr/configsets/_default/conf”目录下,找到“schema.xml”文件,打开后找到`&lt;fields&gt;`标签,添加一个字段类型定义,如下: ```xml &lt;fieldType name="text_ik" class="solr.TextField" ...

    schema.xml说明

    在Solr搜索服务器中,`schema.xml` 文件扮演着核心配置文件的角色,它定义了索引字段、字段类型以及其他与数据结构相关的设置。正确理解和配置`schema.xml`对于实现高性能的全文检索系统至关重要。 #### 一、Schema...

    ikanalyzer-solr5.zip

    3. `schema.xml`或`managed-schema`:Solr的配置文件,可能已经预配置了IK Analyzer作为字段的分析器。 4. `README`或`INSTALL`文件:提供安装和使用指南。 使用这个压缩包,用户可以将IK Analyzer集成到Solr的配置...

    solr schema solrconfig 配置文件解析

    Solr,作为一款开源的全文搜索引擎,其核心配置文件包括`schema.xml`和`solrconfig.xml`,它们是Solr工作方式的基础。在深入理解这两个文件之前,我们需要先了解Solr的基本架构。 **1. Solr架构简介** Solr采用...

    solr6.x_IK中文分词工具

    4. 配置字段类型(FieldType)使用IK分析器,在`schema.xml`文件中: ```xml &lt;fieldType name="text_ik" class="solr.TextField" positionIncrementGap="100"&gt; &lt;tokenizer class="org.wltea.analyzer.lucene....

    solr4.X所用IKAnalyzer中文分词器jar包

    3. **配置Solr**:在`solrconfig.xml`中配置分词器,指定使用IKAnalyzer,并在`schema.xml`中定义字段类型,指定该字段使用IKAnalyzer进行分词。 4. **重启Solr**:完成上述配置后,重启Solr服务器,使新的分词器...

    solr5.5.x的中文分词IKAnalyzer

    在实际应用中,配置IKAnalyzer与Solr集成时,你需要在Solr的schema.xml或managed-schema文件中定义字段类型,并指定使用IKAnalyzer。例如: ```xml &lt;fieldType name="text_ik" class="solr.TextField" ...

    支持solr6.x的中文分词,对solr7的支持暂时没有测试过

    2. **配置Schema**:在Solr的Schema.xml文件中,为需要进行中文分词的字段定义一个Analyzer,指定使用ikanalyzer。例如: ```xml &lt;fieldType name="text_ik" class="solr.TextField" positionIncrementGap="100"&gt; ...

    IKAnalyzer-solr4.x-update.zip

    通过继承Analyzer编写自定义类UseSmartIKAnalyzer和NotUseSmartIKAnalyzer,实现智能分词和最细粒度分词,支持solr4.7通过配置schema.xml实现不同的分词效果 &lt;fieldType name="text_ik" class="solr.TextField"&gt; ...

    solr所需配置文件

    3. **managed-schema**: 在较新的Solr版本中,推荐使用managed-schema替代schema.xml。它提供了动态字段和自动字段类型映射,简化了字段管理。当添加新字段时,系统会自动创建并管理这些字段,减少了手动修改配置的...

    apache-solr-dataimportscheduler-1.0.zip_official54l_solr 5.x定时生成

    3. **配置DataImportHandler**:在对应的Solr核心的`schema.xml`或`managed-schema`文件中,配置DataImportHandler,包括数据源、查询语句、字段映射等信息。 4. **启动定时任务**:一旦配置完成,重启Solr服务器,...

    解决solr启动404问题

    Solr的核心配置文件是`solrconfig.xml`和`schema.xml`,它们定义了索引的结构和处理查询的方式。 当你遇到404错误,首先检查Solr是否成功启动。查看日志文件(通常是`logs/solr.log`)以获取更详细的错误信息。如果...

    ikanalyzer-solr6.zip

    同时,确保Solr的配置文件(如`solrconfig.xml`)能够找到这个库。 2. **配置Analyzer**:在`solrconfig.xml`中,你需要定义一个名为“ik”的Analyzer,指定使用IKAnalyzer。这通常在`&lt;analyzer&gt;`标签内完成,设置`...

    solr6.x的IKAnalyzer整合

    解压下载的压缩包,并找到包含 `IKAnalyzer.cfg.xml` 配置文件和 `lib` 目录下的所有 JAR 文件。 2. **配置 Solr**: 在 Solr 的 `server/solr/configsets/_default/conf` 目录下,创建一个名为 `analyzers` 的...

    solr7.x-ik分词器亲测可用.zip

    - 然后,更新 Solr 的 `schema.xml` 文件,定义字段类型,并指定使用 IK 分词器。例如: ```xml &lt;fieldType name="text_ik" class="solr.TextField"&gt; &lt;tokenizer class="org.wltea.analyzer.lucene....

    ikanalyzer-solr5.rar

    集成IKAnalyzer到Solr的过程中,通常需要修改Solr的配置文件,包括solrconfig.xml和schema.xml。在solrconfig.xml中,需要配置分词器的相关参数,如词典路径等;在schema.xml中,需要定义字段类型(fieldType)并...

Global site tag (gtag.js) - Google Analytics