`

solr schema 经典模式(转)

    博客分类:
  • solr
 
阅读更多

转自:

https://www.cnblogs.com/gaoxu007/p/7214626.html

 

话说,好像是从5.0以后就已经没有schema.xml啦,这是由于Solr5以后增加了一个新的功能,提供schema API修改分词字段类型,通过schemaFactory来配置选择方式。

  可以通过solr下面的conf文件夹中solrConfig.xml可以找到schemaFactory配置,在Solr5之前都是配置ClassicIndexSchemaFactory,

<schemaFactory class="ClassicIndexSchemaFactory"/>

  Solr5以后包括Solr6,默认使用的是ManagedIndexSchemaFactory

<schemaFactory class="ManagedIndexSchemaFactory">
    <bool name="mutable">true</bool>
    <str name="managedSchemaResourceName">managed-schema</str>
  </schemaFactory>

   这里我们就好好聊一聊他们的区别。

 

  1. ClassicIndexSchemaFactory配置后,只能手动编辑schema.xml文件来修改FieldType、Field等等信息,因此这种情况下需要特别的注意在定义模式小心出现漏定义的错误。有人也称这种模式为经典模式。

  2. ManagedIndexSchemaFactory配置被称为manage-schema模式,不支持用户通过修改manage-schema文件去进行FieldType、Field的修改(但实际上是可以manage-schema文件进行修改,并且重启Solr后可以生效)。manage-schema提供一套schema api去创建、修改、删除FieldType、Field等。

  3. 使用ManagedIndexSchemaFactory后,如果删除conf下面的manage-schema,系统会将conf下面的schema.xml重命名为schema.xml.bak,并重新生成一个manage-schema,此时manage-schema中的内容是schema.xml内容格式化得东东。
  4. managedSchemaResourceName属性定义了schema.xml文件的路径,这里使用的是相对路径,因此managed-schema文件跟solrconfig.xml文件在同一个目录中。

注意:本人就是没有太理解,一直认为manage-schema模式下,manage-schema中的配置不能修改,就是修改也能不生效的,其实不然,就算你修改了也可以生效,重启后和通过API修改效果一样。不过如果正的使用这种模式的话也没比较修改,通过web页面添加编辑更加方便。

 

下面介绍一下managed-schema模式下的Schema API

Schema API是一套REST风格的API,用户可以通过浏览器,或者使用某种语言中的HTTPClient对象进行访问。

HTTP Method:POST; Content-type:json,则定义新默认的Java代码为:

 

复制代码
public void addField() throws IOException  
    {  
        String urlStr="http://192.98.219.12:8983/solr/techproducts/schema";  
        URL url=new URL(urlStr);  
        HttpURLConnection connection=(HttpURLConnection) url.openConnection();  
        connection.setRequestMethod("POST");  
        connection.setRequestProperty("Content-type", "application/json");  
        connection.setDoOutput(true);  
        connection.setDoInput(true);  
        BufferedWriter writer=new BufferedWriter(new OutputStreamWriter(connection.getOutputStream()));  
        JSONObject field=new JSONObject();  
        field.put("name", "test");  
        field.put("type", "text_general");  
        field.put("stored", true);  
        JSONObject addDoc=new JSONObject();  
        addDoc.put("add-field",field);  
        System.out.println(addDoc.toString());  
        writer.write(addDoc.toString());  
        writer.flush();  
        writer.close();  
        //  
        BufferedReader reader=new BufferedReader(new InputStreamReader(connection.getInputStream()));  
        while(reader.ready())  
        {  
            System.out.println(reader.readLine());  
        }  
        reader.close();  
    }  
复制代码
 
使用经典模式配置:
 
在solrconfig.xml 中增加:
  <schemaFactory class="ClassicIndexSchemaFactory"/>
并修改:
<!-- The update.autoCreateFields property can be turned to false to disable schemaless mode -->
<updateRequestProcessorChain name="add-unknown-fields-to-the-schema" default="false"
processor="uuid,remove-blank,field-name-mutating,parse-boolean,parse-long,parse-double,parse-date,add-schema-fields">
  <processor class="solr.LogUpdateProcessorFactory"/>
  <processor class="solr.DistributedUpdateProcessorFactory"/>
  <processor class="solr.RunUpdateProcessorFactory"/>
</updateRequestProcessorChain>
 
 defalut = false (原值为:${update.autoCreateFields:true})
分享到:
评论

相关推荐

    solr schema solrconfig 配置文件解析

    Solr,作为一款开源的全文搜索引擎,其核心配置文件包括`schema.xml`和`solrconfig.xml`,它们是Solr工作方式的基础。在深入理解这两个文件之前,我们需要先了解Solr的基本架构。 **1. Solr架构简介** Solr采用...

    Apache Solr(solr-8.11.1.zip)

    1. **SolrCloud模式**:从版本8开始,Solr支持SolrCloud模式,这是一个分布式搜索和索引存储解决方案。它允许Solr集群进行自动故障转移和数据恢复,确保高可用性和容错性。 2. **集合与分片**:在SolrCloud中,数据...

    SOLR的应用教程

    1.2.2 Schema(模式) Schema是Solr的核心配置之一,用于定义索引字段、数据类型、分析器等,它允许用户自定义字段的属性,以满足不同数据的处理需求。 1.2.3 查询 Solr提供丰富的查询语法,包括布尔运算、短语...

    solr ik分词器

    4. **配置字段类型**:在`schema.xml`文件中,为需要用到IK分词器的字段定义一个类型,例如: ```xml &lt;fieldType name="text_ik" class="solr.TextField" positionIncrementGap="100"&gt; &lt;filter class="solr....

    solr7.2.1 ik

    2. **配置Solr Schema**:在Solr的Schema.xml文件中,需要为需要分词的字段指定`&lt;analyzer&gt;`标签,并在其中使用IK分词器。例如: ```xml &lt;fieldType name="text_ik" class="solr.TextField" positionIncrementGap=...

    ikanalyzer-solr8.4.0_solr8_solr_ikanalyzer_中文分词_

    3. **配置Schema.xml**:在 Solr 的 schema.xml 文件中,我们需要定义字段类型(FieldType)并指定使用 ikanalyzer。例如,可以创建一个名为 `text_ik` 的字段类型,并设置其`analyzer_class`属性为 `org.apache....

    solr服务器_solr_

    4. **Schema**:Schema定义了Solr如何解析和存储数据。它包括字段定义(如字段类型、是否可搜索、是否存储等)和动态字段规则。合理的Schema设计是确保Solr性能的关键。 5. **请求处理器(Request Handler)**:...

    最新版windows solr-8.8.2.zip

    4. **Schema设计**:Solr使用Schema.xml文件来定义索引字段,包括字段类型、分词器、过滤器等,这对于优化搜索性能至关重要。 5. **RESTful API**:Solr 8.8.2支持JSON、XML等多种格式的HTTP接口,便于通过编程方式...

    非常经典的solr教程

    最后,我们需要修改 Solr 的配置文件 `schema.xml`,添加新的字段类型以使用 mmseg4j 分词器。在 `types` 节点下,添加以下代码: ```xml &lt;fieldtype name="textComplex" class="solr.TextField" ...

    Solr项目源码及solr资源包

    资源文件(src/main/resources),可能包含Solr配置文件如schema.xml和solrconfig.xml;测试代码(src/test/java),用于验证Solr操作的正确性。 4. **Solr配置文件**: - **schema.xml**:定义了索引的字段类型和...

    solr深入浅出

    在特性方面,Solr不仅利用了Lucene的强大搜索能力,还增加了如Schema模式定义、多种查询选项、核心管理和缓存机制等高级特性。Schema允许用户自定义数据模型,包括字段类型、复制字段和动态字段,以适应不同业务需求...

    ikanalyzer-solr中文分词包兼容solr7.5

    在Solr的Schema设计中,可以为需要分词的字段指定`ikanalyzer`作为分析器,这样在索引和查询时,Solr就会使用ikanalyzer进行分词操作。 总之,ikanalyzer-solr中文分词包为Solr提供了一种强大的中文处理能力,使得...

    solr中文分词器

    2. **配置Solr schema.xml**:在Solr的`conf`目录下,找到`schema.xml`文件,这是定义索引字段和分析器的地方。在`&lt;fields&gt;`标签内,为需要进行中文分词的字段添加`&lt;fieldType&gt;`标签,指定使用IK Analyzer。例如: ...

    solr课件还有安装原件

    在Solr中配置Ik分词器,需要修改配置文件(如solrconfig.xml和schema.xml),将Ik分词器添加到分析链中,并确保与索引字段类型匹配。 总的来说,这套资料提供了从安装Solr到使用Ik分词器进行中文搜索的全面指南。...

    solr教材-PDF版

    - **1.2.2 Schema(模式)**:Solr中的模式文件(schema.xml)用于定义索引的字段、字段类型以及它们的行为。这是构建高效索引的基础。 - **1.2.3 查询**:Solr支持复杂的查询语言,包括全文检索、布尔运算符、短语...

    Solr6.2官方版参考手册

    - **模式定义**: 深入解析 Solr 模式文件,它定义了用于组织数据的字段及其类型,这对于理解 Solr 如何存储和检索数据至关重要。 #### 五、理解分析器、分词器及过滤器 - **文本处理**: 解释 Solr 如何准备文本以...

    支持solr5.5 solr6.0中IK分词需要的资料

    3. **配置分析器**:在Solr的`schema.xml`或`managed-schema`文件中,为需要使用IK分词器的字段定义分析器。 ```xml &lt;fieldType name="text_ik" class="solr.TextField" positionIncrementGap="100"&gt; ...

    solr-7.6.0.zip

    5. **Schemaless模式**:为了简化设置过程,Solr 7.6.0引入了Schemaless模式,允许用户在不定义严格Schema的情况下快速启动和测试搜索服务。系统会自动推断字段类型,但生产环境中仍推荐使用预定义的Schema以确保...

    solr-8.2.0.tgz

    此外,Solr支持分布式搜索,通过SolrCloud模式可以在多个节点间实现数据复制、故障转移和负载均衡,这对于大型企业级应用来说非常重要。在SolrCloud中,ZooKeeper用于协调集群状态,确保高可用性和一致性。 总结...

Global site tag (gtag.js) - Google Analytics