对于Solr的一般属性(General Properties), 它适用于任何Field Type. 有以下一般属性:
Property | Description | Values |
name | ||
class | ||
positionIncrementGap | For multivalued fields, specifies a distance between multiple values, which prevents spurious phrase matches. 对于多值域来说, 在值域之间指定一个距离来防止伪短语的匹配。 |
integer |
autoGeneratePhraseQueries | For text fields. If true, Solr automatically generates phrase queries for adjacent terms. If false, terms must be enclosed in double-quotes to be treated as phrases. 对于text field(solr.TextField), 如果为true, Solr自动地将相邻的词生成短语查询语句。如果为False, terms根据TokenizerFactory划分为不同的短语。 |
true or false |
docValuesFormat | Defines a custom DocValuesFormat to use for fields of this type. This requires that a schema-aware codec, such as the SchemaCodecFactory has been configured in solrconfig.xml. 定义DocValues的存储格式。 |
n/a |
postingsFormat | Defines a custom PostingsFormat to use for fields of this type.This requires that a schema-aware codec, such as the SchemaCodecFactory has been configured in solrconfig.xml. | n/a |
- PositionIncrementGap example:
假如一个document有一个叫"author" 的 multi-valued 域, 值为:
author: John Doe
author: Bob Smith
当PositionIncrementGap =0时, 查询语句(Query):"doe bob", 会匹配这个Field, 显然这不是所希望看到的, 那么 PositionIncrementGap 会解决这个问题, 如:
<fieldType name="text_general" class="solr.TextField" positionIncrementGap="100" multiValued="true"> </fieldType>
2. autoGeneratePhraseQueries, example:
<fieldType name="text_en_splitting" class="solr.TextField" autoGeneratePhraseQueries="true" positionIncrementGap="100">
</fieldType>
<fieldType name="text_ja" class="solr.TextField" autoGeneratePhraseQueries="false"></fieldType>
相关推荐
1. **修改 schema.xml 文件**:打开 `D:\solr\home` 目录下的 schema.xml 文件,增加或修改以下字段类型定义: ```xml <fieldType name="textComplex" class="solr.TextField" positionIncrementGap="100"> ...
在使用Solr-9.0.0时,你需要根据业务需求创建或修改配置文件,如`solrconfig.xml`和`schema.xml`,定义索引的字段类型和字段。然后可以通过POST请求将数据导入Solr,Solr会自动进行分词、建立倒排索引等操作,从而...
`schema.xml`(在较新版本中为managed schema)用于定义字段类型和字段,以及文档结构。 5. **请求处理器**:Solr提供多种请求处理器,如标准请求处理器(StandardRequestHandler)用于处理默认的搜索请求,更新...
6. **server/solr 目录**:存储了配置集合的目录,每个集合都有自己的配置文件,如`schema.xml`用于定义字段和字段类型,`solrconfig.xml`定义了索引和查询的行为。 7. **contrib 目录**:包含了一些社区贡献的模块...
- **Field**:文档中的属性,定义了数据类型和分析方式。 - **Query**:Solr支持丰富的查询语法,包括Lucene查询语法、Solr查询API等。 8. **SolrCloud模式**:如果项目涉及到SolrCloud,那么还需要了解分布式...
它包括字段定义(如字段类型、是否可搜索、是否存储等)和动态字段规则。合理的Schema设计是确保Solr性能的关键。 5. **请求处理器(Request Handler)**:Solr通过Request Handler来处理HTTP请求,如搜索、添加、...
例如,可以创建一个名为 `text_ik` 的字段类型,并设置其`analyzer_class`属性为 `org.apache.lucene.analysis.cn.ikanalyzer.IKAnalyzer`。 ```xml <fieldType name="text_ik" class="solr.TextField" ...
solr.warsolr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包...
- **配置**:Solr的配置文件在`conf`目录下,包括schema.xml(定义字段和字段类型)、solrconfig.xml(配置索引和查询行为)等。 - **集合与分片**:在分布式环境中,Solr将数据分为多个集合,每个集合可以进一步...
Solr是Apache软件基金会开发的一款开源全文搜索引擎,它基于Java平台,是Lucene的一个扩展,提供了更为方便和强大的搜索功能。在Solr 6.2.0版本中,这个强大的分布式搜索引擎引入了许多新特性和改进,使其在处理大...
4. **Faceting(分面搜索)**:Solr提供了强大的分面搜索功能,允许用户根据特定的属性进行过滤和统计,帮助用户快速浏览和理解大量数据。 5. **Highlighting(高亮显示)**:4.10.3版本的Solr支持查询结果中的...
Solr,全称为Apache Solr,是一款开源的企业级全文搜索引擎,由Apache软件基金会开发并维护。它是基于Java的,因此在使用Solr之前,确保你的系统已经安装了Java 8或更高版本是至关重要的。标题"solr-7.4.0.zip"表明...
5. **更新字段类型和配置**:完成上述配置后,别忘了重新启动你的Solr服务器,使改动生效。 6. **测试分词器**:最后,你可以通过Solr的分析界面(通常在`http://your-solr-url/admin/analysis.jsp`)输入文本,...
Solr是Apache Lucene项目的一个子项目,是一个高性能、基于Java的企业级全文搜索引擎服务器。当你在尝试启动Solr时遇到404错误,这通常意味着Solr服务没有正确地启动或者配置文件设置不正确。404错误表示“未找到”...
3. **配置与部署**:Solr的配置文件位于`conf`目录下,包括schema.xml(定义字段和字段类型)、solrconfig.xml(配置索引和查询参数)等。用户可以根据需求自定义这些配置。部署Solr通常涉及解压下载的`solr-4.10.3....
Schema是Solr的核心配置之一,用于定义索引字段、数据类型、分析器等,它允许用户自定义字段的属性,以满足不同数据的处理需求。 1.2.3 查询 Solr提供丰富的查询语法,包括布尔运算、短语匹配、范围查询等,还支持...
配置文件主要是`solrconfig.xml`和`schema.xml`,前者定义了Solr的行为,后者定义了字段类型和文档结构。 `solrconfig.xml`中可以配置请求处理器、缓存策略、更新处理流程等。例如,添加`update.autoCommit`设置...
设置`docBase`属性为`E:\ruanjian\lucene-3.6.2\solr\server\solr`,这是你的Solr应用的路径。 5. **配置Context**: 更新Tomcat的`Context`设置,确保Solr能够正确加载。在`solr.xml`文件中,你需要正确配置`...
### Solr 学习知识点详解 #### 一、Solr 概述 - **定义**:Solr 是 Apache 下的一个顶级开源项目,采用 Java 开发,它是基于 Lucene 的全文搜索服务器。Solr 可以独立运行在 Jetty、Tomcat 等 Servlet 容器中。 -...
- `schema.xml`:定义了字段类型和字段,决定了如何解析和存储文档数据。 4. **运行与管理**: - 使用命令行工具启动Solr,通常是在Solr的bin目录下执行`start.jar`或相应的脚本。 - 通过Web界面创建、删除和...