schema.xml 在solr/conf/目录下,类似于数据表配置文件。
为了改进性能,可以采取以下几种措施:
1. 将所有只用于搜索的,而不需要作为查询结果的field(特别是一些比较大的field)的stored设置为false。
2. 将不需要被用于搜索的,而只是作为查询结果返回的field的indexed设置为false。
3. 删除所有不必要的copyField声明,根据需要决定是否进行存储。
4. 为了索引字段的最小化和搜索的效率,将所有的 text fields的index都设置成false,然后使用copyField将他们都复制到一个总的 text field上,然后对他进行搜索。
5. 使用尽可能高的Log输出等级,减少日志量。可以在solr/admin 中的 LOGGING 进行设置。
特珠说明:
1. 高高是基于分词的,所有存储需要高亮显示的字段 一定要分词(text)才能高亮显示。
2. 排序字段 是不能当 查询过滤的条件。
文本主要配置项:
1. field 类型定义
重点是中文分词的添加
2. field 各属性定义
name type类型 indexed是否建立索引 stored是否存储 required 是否必填项 multiValued多值存储
3. 唯一key
<uniqueKey>id</uniqueKey>
文档的唯一标识, 必须填写这个field(除非该field被标记required="false"),否则solr建立索引报错。
4. 默认搜索字段 field
<defaultSearchField>text</defaultSearchField>
如果搜索参数中没有指定具体的field,那么这个做为默认的域。
5. 搜索参数短语间逻辑
<solrQueryParser defaultOperator="OR"/>
配置搜索参数短语间的逻辑,可以是"AND|OR"。
备注: AND是交集,OR是并集
6. 复制字段
<copyField source="content" dest="text"/>
将多个字段的值 复制至 一个字段中,如果被复制的字段都设置为stored,那个这个字段务必不要设置成stored=true
7. 自定义评分器
<similarity class="......SolrSimilarity"/>
SolrSimilarity 是继承 DefaultSimilarity的子类,或者实现评分器接口的类。
分享到:
相关推荐
### Solrconfig.xml 和 Schema.xml 说明 #### Solrconfig.xml 概述 Solrconfig.xml 是 Apache Solr 的核心配置文件之一,主要用于定义 Solr 实例如何处理文档的索引与查询请求。该文件中包含了多种配置项,用于...
配置文件(如`schema.xml`或`solrconfig.xml`)需要更新以指示Solr使用IKAnalyzer进行分词。JAR库文件(如`ik-analyzer.jar`)则需要添加到Solr的类路径中,以便在运行时能够加载和使用分词器。字典文件通常包含预定...
2. **配置Solr schema.xml**:在Solr的schema.xml配置文件中,为需要分词的字段指定`<analyzer>`标签,使用IKAnalyzer的类名,如`org.wltea.analyzer.lucene.IKAnalyzer`。 3. **启动Solr**:更新完配置后,重启Solr...
在“server/solr/configsets/_default/conf”目录下,找到“schema.xml”文件,打开后找到`<fields>`标签,添加一个字段类型定义,如下: ```xml <fieldType name="text_ik" class="solr.TextField" ...
在Solr搜索服务器中,`schema.xml` 文件扮演着核心配置文件的角色,它定义了索引字段、字段类型以及其他与数据结构相关的设置。正确理解和配置`schema.xml`对于实现高性能的全文检索系统至关重要。 #### 一、Schema...
3. `schema.xml`或`managed-schema`:Solr的配置文件,可能已经预配置了IK Analyzer作为字段的分析器。 4. `README`或`INSTALL`文件:提供安装和使用指南。 使用这个压缩包,用户可以将IK Analyzer集成到Solr的配置...
Solr,作为一款开源的全文搜索引擎,其核心配置文件包括`schema.xml`和`solrconfig.xml`,它们是Solr工作方式的基础。在深入理解这两个文件之前,我们需要先了解Solr的基本架构。 **1. Solr架构简介** Solr采用...
4. 配置字段类型(FieldType)使用IK分析器,在`schema.xml`文件中: ```xml <fieldType name="text_ik" class="solr.TextField" positionIncrementGap="100"> <tokenizer class="org.wltea.analyzer.lucene....
3. **配置Solr**:在`solrconfig.xml`中配置分词器,指定使用IKAnalyzer,并在`schema.xml`中定义字段类型,指定该字段使用IKAnalyzer进行分词。 4. **重启Solr**:完成上述配置后,重启Solr服务器,使新的分词器...
在实际应用中,配置IKAnalyzer与Solr集成时,你需要在Solr的schema.xml或managed-schema文件中定义字段类型,并指定使用IKAnalyzer。例如: ```xml <fieldType name="text_ik" class="solr.TextField" ...
2. **配置Schema**:在Solr的Schema.xml文件中,为需要进行中文分词的字段定义一个Analyzer,指定使用ikanalyzer。例如: ```xml <fieldType name="text_ik" class="solr.TextField" positionIncrementGap="100"> ...
通过继承Analyzer编写自定义类UseSmartIKAnalyzer和NotUseSmartIKAnalyzer,实现智能分词和最细粒度分词,支持solr4.7通过配置schema.xml实现不同的分词效果 <fieldType name="text_ik" class="solr.TextField"> ...
3. **managed-schema**: 在较新的Solr版本中,推荐使用managed-schema替代schema.xml。它提供了动态字段和自动字段类型映射,简化了字段管理。当添加新字段时,系统会自动创建并管理这些字段,减少了手动修改配置的...
3. **配置DataImportHandler**:在对应的Solr核心的`schema.xml`或`managed-schema`文件中,配置DataImportHandler,包括数据源、查询语句、字段映射等信息。 4. **启动定时任务**:一旦配置完成,重启Solr服务器,...
Solr的核心配置文件是`solrconfig.xml`和`schema.xml`,它们定义了索引的结构和处理查询的方式。 当你遇到404错误,首先检查Solr是否成功启动。查看日志文件(通常是`logs/solr.log`)以获取更详细的错误信息。如果...
同时,确保Solr的配置文件(如`solrconfig.xml`)能够找到这个库。 2. **配置Analyzer**:在`solrconfig.xml`中,你需要定义一个名为“ik”的Analyzer,指定使用IKAnalyzer。这通常在`<analyzer>`标签内完成,设置`...
解压下载的压缩包,并找到包含 `IKAnalyzer.cfg.xml` 配置文件和 `lib` 目录下的所有 JAR 文件。 2. **配置 Solr**: 在 Solr 的 `server/solr/configsets/_default/conf` 目录下,创建一个名为 `analyzers` 的...
- 然后,更新 Solr 的 `schema.xml` 文件,定义字段类型,并指定使用 IK 分词器。例如: ```xml <fieldType name="text_ik" class="solr.TextField"> <tokenizer class="org.wltea.analyzer.lucene....
集成IKAnalyzer到Solr的过程中,通常需要修改Solr的配置文件,包括solrconfig.xml和schema.xml。在solrconfig.xml中,需要配置分词器的相关参数,如词典路径等;在schema.xml中,需要定义字段类型(fieldType)并...