<field name="id" type="string" indexed="true" stored="true" required="true" multiValued="false" /> |
常用的公共属性有:
name:标识。
type:fieldType定义的类型。
indexed=true|false:是否被用来建立索引(关系到搜索和排序)
stored=true|false:是否储存
compressed=true|false,是否使用gzip压缩(只有TextField和StrField可以压缩)
compressThreshold=压缩阀值
multiValued=true|false 是否包含多个值,即一个名字可以被多个document所用。
omitNorms=true|false这是个高级选项。设置为true,省略与这一field相关的规范(这将禁用长度规范化和索引时间权重( index-time boosting for the field),并节省一些内存)。仅仅用在全文本field。
termVectors=false|true 如果设置为true,则包含了所有的term vector 信息。通常用的属性有:
termPositions=”true”:存储 term vector中的地址信息,会消耗存储开销。
termOffsets:存储 term vector 的偏移量,会消耗存储开销。
更多有关信息请参考:http://wiki.apache.org/solr/TermVectorComponent
omitTermFreqAndPositions=true|false 如果设置,省略掉freq和term vector中的地址信息
omitPositions=true|false如果设置,省略掉term vector中的地址信息
default:如果没有属性需要修改,就可以用这个标识下。
英文原文:
Common options that fields can have are... default The default value for this field if none is provided while adding documents indexed=true|false True if this field should be "indexed". If (and only if) a field is indexed, then it is searchable, sortable, and facetable. stored=true|false True if the value of the field should be retrievable during a search, or if you're using highlighting or MoreLikeThis. compressed=true|false True if this field should be stored using gzip compression. (This will only apply if the field type is compressible; among the standard field types, only TextField and StrField are.) compressThreshold=<integer> multiValued=true|false True if this field may contain multiple values per document, i.e. if it can appear multiple times in a document omitNorms=true|false This is arguably an advanced option. Set to true to omit the norms associated with this field (this disables length normalization and index-time boosting for the field, and saves some memory). Only full-text fields or fields that need an index-time boost need norms. termVectors=false|true <?> Solr 1.1 If set, include full term vector info. If enabled, often also used with termPositions="true" and termOffsets="true". To use interactively, requires TermVectorComponent Corresponds to TV button in Luke, and V field attribute. omitTermFreqAndPositions=true|false <!> Solr1.4 If set, omit term freq, positions and payloads from postings for this field. This can be a performance boost for fields that don't require that information and reduces storage space required for the index. Queries that rely on position that are issued on a field with this option fail with an exception. Prior to <!> Solr4.0 the queries would silently fail to find documents. omitPositions=true|false <!> Solr3.4 If set, omits positions, but keeps term frequencies |
相关推荐
### Solr中的schema.xml详解 在Solr搜索服务器中,`schema.xml` 文件扮演着核心配置文件的角色,它定义了索引字段、字段类型以及其他与数据结构相关的设置。正确理解和配置`schema.xml`对于实现高性能的全文检索...
在“server/solr/configsets/_default/conf”目录下,找到“schema.xml”文件,打开后找到`<fields>`标签,添加一个字段类型定义,如下: ```xml <fieldType name="text_ik" class="solr.TextField" ...
Solr,作为一款开源的全文搜索引擎,其核心配置文件包括`schema.xml`和`solrconfig.xml`,它们是Solr工作方式的基础。在深入理解这两个文件之前,我们需要先了解Solr的基本架构。 **1. Solr架构简介** Solr采用...
### Window下Solr1.4安装部署的知识点详解 #### 一、Solr简介 Apache Solr 是一个高性能、基于Lucene的全文检索服务。它提供了丰富的功能集,包括高度可扩展性、易于部署和强大的搜索功能。Solr 1.4版本是在2009年...
### Solr中的MMSeg4J中文分词器安装与配置详解 #### 一、MMSeg4J简介 MMSeg4J是一款高效的Java实现的中文分词工具包,它基于统计和规则混合的方法来处理中文文本的分词问题。在搜索引擎如Solr中,通过集成MMSeg4J...
打开`home/config/schema.xml`文件,根据分词器提供的`README.txt`文件指示,将关于Fieldtype的内容添加到`<types>`部分。 3. **创建词典文件**: 在`home`目录下新建一个名为`dic`的文件夹,将mmseg分词器的数据...
### Solr概述与安装配置详解 #### 一、Solr简介 Solr是一个高度可扩展且功能丰富的开源全文搜索引擎平台,被广泛应用于企业级搜索应用之中。它基于Apache Lucene库构建,支持分布式检索和复杂的搜索特性,如拼写...
3. **修改 schema.xml 文件**:在 Solr 的配置文件 `schema.xml` 中添加相应的 FieldType 配置,以启用 IKAnalyzer 的分词功能。 ```xml <fieldType name="text_ik" class="solr.TextField"> ...
#### Schema.xml配置文件详解 `Schema.xml`是Solr中最核心的配置文件之一,它定义了索引中的字段类型、字段和动态字段等关键信息。该文件被分为三个主要部分: 1. **类型(Types)**:定义了各种字段类型及其关联的...
2. **schema.xml**: 描述索引字段,包括字段名称、类型、是否可被搜索、存储等属性。例如,`<field name="title" type="text_general" indexed="true" stored="true"/>`表示`title`字段是全文索引且存储。 3. **...
- **配置(Configuration)**: Solr 的配置文件位于 `conf` 目录下,包括 `schema.xml`(定义字段和字段类型)、`solrconfig.xml`(设置索引和查询行为)等,这些配置决定了 Solr 的行为。 **2. 安装与启动** 下载...
schema.xml文件中包括Field、Field类型、分词器等配置项。 Solr数据操作 Solr支持数据导入、索引构建、搜索等操作。DataImportHandler(DIH)是Solr提供的一种数据导入工具,可以将数据从各种数据源导入到Solr中。 ...
编辑`E:\Solr\home\conf\schema.xml`文件,添加mmseg4j分词器的配置: ```xml <fieldType name="textComplex" class="solr.TextField"> <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode=...
### Solr 4.7 从数据库导入数据创建索引详解 #### 一、概述 在实际工程应用中,从数据库导出数据并创建索引来优化搜索效率是一种常见的做法。本文将详细介绍如何使用Solr 4.7从SQL Server 2005数据库中导入数据并...
`schema.xml`是Apache Solr的核心配置文件之一,它定义了索引的数据结构和字段类型,对搜索引擎的行为进行详细设置。在WPSOLR中,这个文件用于定制你的WordPress数据如何被索引和检索。 #### 1.1 字段定义 - **字段...
- **`schema.xml`**:定义了文档中的字段及其属性,如字段的数据类型、是否索引、是否存储等。 - **字段定义**:通过`<field>`标签定义字段属性。 - **数据类型指定**:通过`<fieldType>`指定数据类型。 - **...