`

solrStudy1-solr字段详解

    博客分类:
  • solr
 
阅读更多
1.
动态字段(Dynamic fields)允许 solr 索引没有在 schema 中明确定义的字段。这个在忘记定义一些字段时很有用。动态字段可以让系统更灵活,通用性更强。
动态字段和成规字段类似,除了它名字中包含一个通配符外,在索引文档时,一个字段如果在常规字段中没有匹配时,将到动态字段中匹配。
假设schema中定义了一个叫*_i的动态动态字段,如果要索引一个叫 cost_i 的字段,但是 schema 中不存在 cost_i 的字段,这样 cost_i  将被索引到 *_i 字段中。
动态字段也是定义在 schema.xml 文件中,和其他字段一样,它也有个名词,字段类型,和属性。
1
<dynamicField name="*_i" type="sint" indexed="true" stored="true"/>

建议在 schema.xml 定义一些基本的动态字段,以备扩展之用。

2.

你可能想让document的一些字段可以多次使用。solr 有一个字段复制机制,可以提交多个不同类型字段集中到一个字段。字段复制主要涉及两个概念,source和destination,一个是要复制的字段,另一个是要复制到哪个字段,以下是个例子:

1
<copyField source="cat" dest="text" maxChars="30000" />

上例中,如果text字段有数据的话,cat字段的内容将被添加到text字段中。maxChars 参数,一个int类型参数,用于限制复制的字符数。

source和destination都支持通配符。以下是一个将所有以 _t 结尾的字段全部复制到text字段中。
1
<copyField source="*_t" dest="text" maxChars="25000" />
 

3.

一旦定义好了字段类型,定义一个字段就变得比较简单了。所有该做的就是指定一个名称和一个字段类型。如果你愿意,可以提供可选的内容用于替换字段类型中的定义的属性。

字段定义在 schema.xml 的 fields 元素下,以下的例子定义了一个 sfloat 类型的 price 字段。
1
<field name="price" type="sfloat" indexed="true" stored="true"/>

4.

字段类型的类决定了字段的大部分形态,同时部分属性在schema.xml中也是可以定义的。举个例子,以下顶了日期类型的两个属性:sortMissingLast 和 omitNorms:

<fieldType name=”date”

sortMissingLast=”true” omitNorms=”true”/>

大部分的属性是 true 或 false。

这里是一些常用的属性:

 

字段属性

描述

indexed

如果为true,该字段可以被搜索

True 或 false

stored

如果为true,该字段可以值将被保存在索引库

True或 false

sortMissingFirst

sortMissingLast

X暂时不太理解

True或 false

multiValued

如果为true,该字段可以保存多个值

True或 false

positionIncrementGap

用于多值字段,表示多个值之间的距离,防止错误的短语匹配

整数

omitNorms

如果为true,忽略该字段的norms,只有全文字段或者字段在索引时设置boost需要norms。

True或 false

omitTermFreqAndPositions

 

True或 false

autoGeneratePhraseQueries

   
分享到:
评论

相关推荐

    ik-analyzer-solr7.zip

    3. 更新Solr的`schema.xml`文件,为需要分词的字段指定`analyzer`元素,并设置为IKAnalyzer。例如: ```xml &lt;fieldType name="text_ik" class="solr.TextField" positionIncrementGap="100"&gt; ``` ...

    ik-analyzer-solr-6.x.jar

    solr更新到6.x的版本了,ik-...ik-analyzer-solr-6.0.0.jar ik-analyzer-solr-6.2.1.jar ik-analyzer-solr-6.3.0.jar 更多的相关信息,请参照我的博客 http://blog.csdn.net/Bleachswh/article/details/53228614

    ikanalyzer-solr5

    1. 将 ikanalyzer-solr5 解压后,将其中的 jar 包复制到 Solr 的 `server/solr-webapp/webapp/WEB-INF/lib` 目录下,这样 Solr 就可以加载这个分词器。 2. 配置 Solr 的 schema.xml 文件,指定使用 ikanalyzer 作为...

    ik-analyzer-solr5-5.x.jar

    中文分词器ik-analyzer-solr5-5.x.jar,已经打包好,直接用就可以 2积分不黑心

    spring-data-solr 4.0.5.RELEASE 最新版本配置和小Demo

    目前在网上只能找到以前最老spring-data-solr 1.x.x 版本的配置和说明,最新版本的根本找不到,在参考spring-data-solr 官网文档后写的配置和小Demo,spring-data-solr 所使用的是目前最新版本的 spring-data-solr ...

    apache-solr-3.5.0.jar

    1. `apache-solr-core-3.5.0.jar`: 这是Solr的核心库,包含了实现全文索引、查询、排序和结果高亮等功能的基础代码。其中,Solr服务器的核心功能如索引存储、查询处理、请求处理器和响应生成器都封装在这个JAR文件里...

    apache-solr-dataimportscheduler-1.0.zip_official54l_solr 5.x定时生成

    1. **配置Solr服务器**:首先,将`apache-solr-dataimportscheduler-1.0.jar`添加到Solr服务器的`lib`目录下,确保服务器启动时能加载这个库。 2. **添加Scheduler配置**:在Solr的配置文件`solrconfig.xml`中,你...

    solr增量更新架包apache-solr-dataimportscheduler.jar

    "apache-solr-dataimportscheduler.jar" 是一个专门为Solr设计的扩展包,用于实现自动化的数据增量更新调度。 首先,我们要理解Solr的数据导入过程。Solr使用DataImportHandler(DIH)来从关系型数据库、XML文件或...

    mmseg4j-solr-2.4.0.jar

    本文将深入探讨mmseg4j在Solr中的应用,以及如何在Solr 6.3版本中集成并使用mmseg4j-solr-2.4.0.jar这个库。 首先,mmseg4j是由李智勇开发的一个基于Java的中文分词工具,它的全称是“Minimum Match Segmentation ...

    ik-analyzer-solr7-7.x.zip

    标题“ik-analyzer-solr7-7.x.zip”表明这是一个与Solr7相关的压缩包,其中包含了IK Analyzer,一个广泛使用的中文分词工具。这个压缩包特别为Solr7版本进行了优化,提供了完整的配置文件,使得用户可以方便地集成到...

    mmseg4j-solr全版本及配置

    "mmseg4j-solr-2.x.x-with-mmseg4j-core.zip"系列文件则代表了mmseg4j-solr的不同版本,其中x.x代表具体的版本号。这些版本间的差异主要在于对Solr的适应性、分词算法的优化以及可能新增的功能。升级或降级时,...

    apache-solr-3.6.2.zip

    apache-solr-3.6.2.zipapache-solr-3.6.2.zipapache-solr-3.6.2.zipapache-solr-3.6.2.zipapache-solr-3.6.2.zipapache-solr-3.6.2.zipapache-solr-3.6.2.zip

    mmseg4j-solr-mmseg4j-solr-2.2.0.zip

    1. **安装与配置**:将mmseg4j-solr-2.2.0的jar包添加到Solr的lib目录下,然后在Solr的schema.xml中配置分词器,指定使用mmseg4j-solr的分词算法。 2. **定制词典**:mmseg4j-solr允许用户自定义词典,以适应特定...

    apache-solr-core-1.4.0.jar

    apache-solr-core-1.4.0.jar,apache-solr-core-1.4.0.jar

    apache-solr-1.4.0.zip_apache-solr _apache-solr-1.4.0_apache-solr

    在压缩包"apache-solr-1.4.0"中,包含了Solr的源代码、配置文件、示例文档以及其他必要的资源。对于喜欢研究Solr的人来说,这些源代码是深入理解其工作原理、定制功能以及优化性能的重要资料。通过对这些源码的研究...

    apache-solr-dataimportscheduler-1.4

    solr6.1.0版本jar已经不再提供读取自动索引配置文件路径的方法,因此apache-solr-dataimportscheduler-1.0内调用该方法的所有操作都无法实现。于是需要下载apache-solr-dataimportscheduler-1.0-with-source.jar并...

    mmseg4j-solr总共4个文件

    里面包含了mmseg4j-solr-2.0.0.jar,mmseg4j-solr-2.1.0.jar,mmseg4j-solr-2.2.0.jar,mmseg4j-solr-2.3.0.jar总共4个文件,其中: mmseg4j-solr-2.0.0.jar 要求 lucene/solr &gt;= 4.3.0。在 lucene/solr [4.3.0, 4.7.1]...

Global site tag (gtag.js) - Google Analytics