转自:
https://www.cnblogs.com/gaoxu007/p/7214626.html
话说,好像是从5.0以后就已经没有schema.xml啦,这是由于Solr5以后增加了一个新的功能,提供schema API修改分词字段类型,通过schemaFactory来配置选择方式。
可以通过solr下面的conf文件夹中solrConfig.xml可以找到schemaFactory配置,在Solr5之前都是配置ClassicIndexSchemaFactory,
<schemaFactory class="ClassicIndexSchemaFactory"/>
Solr5以后包括Solr6,默认使用的是ManagedIndexSchemaFactory
<schemaFactory class="ManagedIndexSchemaFactory"> <bool name="mutable">true</bool> <str name="managedSchemaResourceName">managed-schema</str> </schemaFactory>
这里我们就好好聊一聊他们的区别。
-
ClassicIndexSchemaFactory配置后,只能手动编辑schema.xml文件来修改FieldType、Field等等信息,因此这种情况下需要特别的注意在定义模式小心出现漏定义的错误。有人也称这种模式为经典模式。
-
ManagedIndexSchemaFactory配置被称为manage-schema模式,不支持用户通过修改manage-schema文件去进行FieldType、Field的修改(但实际上是可以manage-schema文件进行修改,并且重启Solr后可以生效)。manage-schema提供一套schema api去创建、修改、删除FieldType、Field等。
- 使用ManagedIndexSchemaFactory后,如果删除conf下面的manage-schema,系统会将conf下面的schema.xml重命名为schema.xml.bak,并重新生成一个manage-schema,此时manage-schema中的内容是schema.xml内容格式化得东东。
- managedSchemaResourceName属性定义了schema.xml文件的路径,这里使用的是相对路径,因此managed-schema文件跟solrconfig.xml文件在同一个目录中。
注意:本人就是没有太理解,一直认为manage-schema模式下,manage-schema中的配置不能修改,就是修改也能不生效的,其实不然,就算你修改了也可以生效,重启后和通过API修改效果一样。不过如果正的使用这种模式的话也没比较修改,通过web页面添加编辑更加方便。
下面介绍一下managed-schema模式下的Schema API
Schema API是一套REST风格的API,用户可以通过浏览器,或者使用某种语言中的HTTPClient对象进行访问。
HTTP Method:POST; Content-type:json,则定义新默认的Java代码为:
public void addField() throws IOException { String urlStr="http://192.98.219.12:8983/solr/techproducts/schema"; URL url=new URL(urlStr); HttpURLConnection connection=(HttpURLConnection) url.openConnection(); connection.setRequestMethod("POST"); connection.setRequestProperty("Content-type", "application/json"); connection.setDoOutput(true); connection.setDoInput(true); BufferedWriter writer=new BufferedWriter(new OutputStreamWriter(connection.getOutputStream())); JSONObject field=new JSONObject(); field.put("name", "test"); field.put("type", "text_general"); field.put("stored", true); JSONObject addDoc=new JSONObject(); addDoc.put("add-field",field); System.out.println(addDoc.toString()); writer.write(addDoc.toString()); writer.flush(); writer.close(); // BufferedReader reader=new BufferedReader(new InputStreamReader(connection.getInputStream())); while(reader.ready()) { System.out.println(reader.readLine()); } reader.close(); }
相关推荐
Solr,作为一款开源的全文搜索引擎,其核心配置文件包括`schema.xml`和`solrconfig.xml`,它们是Solr工作方式的基础。在深入理解这两个文件之前,我们需要先了解Solr的基本架构。 **1. Solr架构简介** Solr采用...
1. **SolrCloud模式**:从版本8开始,Solr支持SolrCloud模式,这是一个分布式搜索和索引存储解决方案。它允许Solr集群进行自动故障转移和数据恢复,确保高可用性和容错性。 2. **集合与分片**:在SolrCloud中,数据...
1.2.2 Schema(模式) Schema是Solr的核心配置之一,用于定义索引字段、数据类型、分析器等,它允许用户自定义字段的属性,以满足不同数据的处理需求。 1.2.3 查询 Solr提供丰富的查询语法,包括布尔运算、短语...
4. **配置字段类型**:在`schema.xml`文件中,为需要用到IK分词器的字段定义一个类型,例如: ```xml <fieldType name="text_ik" class="solr.TextField" positionIncrementGap="100"> <filter class="solr....
2. **配置Solr Schema**:在Solr的Schema.xml文件中,需要为需要分词的字段指定`<analyzer>`标签,并在其中使用IK分词器。例如: ```xml <fieldType name="text_ik" class="solr.TextField" positionIncrementGap=...
3. **配置Schema.xml**:在 Solr 的 schema.xml 文件中,我们需要定义字段类型(FieldType)并指定使用 ikanalyzer。例如,可以创建一个名为 `text_ik` 的字段类型,并设置其`analyzer_class`属性为 `org.apache....
4. **Schema**:Schema定义了Solr如何解析和存储数据。它包括字段定义(如字段类型、是否可搜索、是否存储等)和动态字段规则。合理的Schema设计是确保Solr性能的关键。 5. **请求处理器(Request Handler)**:...
4. **Schema设计**:Solr使用Schema.xml文件来定义索引字段,包括字段类型、分词器、过滤器等,这对于优化搜索性能至关重要。 5. **RESTful API**:Solr 8.8.2支持JSON、XML等多种格式的HTTP接口,便于通过编程方式...
最后,我们需要修改 Solr 的配置文件 `schema.xml`,添加新的字段类型以使用 mmseg4j 分词器。在 `types` 节点下,添加以下代码: ```xml <fieldtype name="textComplex" class="solr.TextField" ...
资源文件(src/main/resources),可能包含Solr配置文件如schema.xml和solrconfig.xml;测试代码(src/test/java),用于验证Solr操作的正确性。 4. **Solr配置文件**: - **schema.xml**:定义了索引的字段类型和...
在特性方面,Solr不仅利用了Lucene的强大搜索能力,还增加了如Schema模式定义、多种查询选项、核心管理和缓存机制等高级特性。Schema允许用户自定义数据模型,包括字段类型、复制字段和动态字段,以适应不同业务需求...
在Solr的Schema设计中,可以为需要分词的字段指定`ikanalyzer`作为分析器,这样在索引和查询时,Solr就会使用ikanalyzer进行分词操作。 总之,ikanalyzer-solr中文分词包为Solr提供了一种强大的中文处理能力,使得...
2. **配置Solr schema.xml**:在Solr的`conf`目录下,找到`schema.xml`文件,这是定义索引字段和分析器的地方。在`<fields>`标签内,为需要进行中文分词的字段添加`<fieldType>`标签,指定使用IK Analyzer。例如: ...
在Solr中配置Ik分词器,需要修改配置文件(如solrconfig.xml和schema.xml),将Ik分词器添加到分析链中,并确保与索引字段类型匹配。 总的来说,这套资料提供了从安装Solr到使用Ik分词器进行中文搜索的全面指南。...
- **1.2.2 Schema(模式)**:Solr中的模式文件(schema.xml)用于定义索引的字段、字段类型以及它们的行为。这是构建高效索引的基础。 - **1.2.3 查询**:Solr支持复杂的查询语言,包括全文检索、布尔运算符、短语...
- **模式定义**: 深入解析 Solr 模式文件,它定义了用于组织数据的字段及其类型,这对于理解 Solr 如何存储和检索数据至关重要。 #### 五、理解分析器、分词器及过滤器 - **文本处理**: 解释 Solr 如何准备文本以...
3. **配置分析器**:在Solr的`schema.xml`或`managed-schema`文件中,为需要使用IK分词器的字段定义分析器。 ```xml <fieldType name="text_ik" class="solr.TextField" positionIncrementGap="100"> ...
5. **Schemaless模式**:为了简化设置过程,Solr 7.6.0引入了Schemaless模式,允许用户在不定义严格Schema的情况下快速启动和测试搜索服务。系统会自动推断字段类型,但生产环境中仍推荐使用预定义的Schema以确保...
此外,Solr支持分布式搜索,通过SolrCloud模式可以在多个节点间实现数据复制、故障转移和负载均衡,这对于大型企业级应用来说非常重要。在SolrCloud中,ZooKeeper用于协调集群状态,确保高可用性和一致性。 总结...