1
|
< dynamicField name = "*_i" type = "sint" indexed = "true" stored = "true" />
|
建议在 schema.xml 定义一些基本的动态字段,以备扩展之用。
2.
你可能想让document的一些字段可以多次使用。solr 有一个字段复制机制,可以提交多个不同类型字段集中到一个字段。字段复制主要涉及两个概念,source和destination,一个是要复制的字段,另一个是要复制到哪个字段,以下是个例子:
1
|
< copyField source = "cat" dest = "text" maxChars = "30000" />
|
上例中,如果text字段有数据的话,cat字段的内容将被添加到text字段中。maxChars 参数,一个int类型参数,用于限制复制的字符数。
1
|
< copyField source = "*_t" dest = "text" maxChars = "25000" />
|
3.
一旦定义好了字段类型,定义一个字段就变得比较简单了。所有该做的就是指定一个名称和一个字段类型。如果你愿意,可以提供可选的内容用于替换字段类型中的定义的属性。
1
|
< field name = "price" type = "sfloat" indexed = "true" stored = "true" />
|
4.
<fieldType name=”date” sortMissingLast=”true” omitNorms=”true”/> |
大部分的属性是 true 或 false。
这里是一些常用的属性:
字段属性 |
描述 |
值 |
indexed |
如果为true,该字段可以被搜索 |
True 或 false |
stored |
如果为true,该字段可以值将被保存在索引库 |
True或 false |
sortMissingFirst sortMissingLast |
X暂时不太理解 |
True或 false |
multiValued |
如果为true,该字段可以保存多个值 |
True或 false |
positionIncrementGap |
用于多值字段,表示多个值之间的距离,防止错误的短语匹配 |
整数 |
omitNorms |
如果为true,忽略该字段的norms,只有全文字段或者字段在索引时设置boost需要norms。 |
True或 false |
omitTermFreqAndPositions |
True或 false |
|
autoGeneratePhraseQueries |
相关推荐
3. 更新Solr的`schema.xml`文件,为需要分词的字段指定`analyzer`元素,并设置为IKAnalyzer。例如: ```xml <fieldType name="text_ik" class="solr.TextField" positionIncrementGap="100"> ``` ...
solr更新到6.x的版本了,ik-...ik-analyzer-solr-6.0.0.jar ik-analyzer-solr-6.2.1.jar ik-analyzer-solr-6.3.0.jar 更多的相关信息,请参照我的博客 http://blog.csdn.net/Bleachswh/article/details/53228614
1. 将 ikanalyzer-solr5 解压后,将其中的 jar 包复制到 Solr 的 `server/solr-webapp/webapp/WEB-INF/lib` 目录下,这样 Solr 就可以加载这个分词器。 2. 配置 Solr 的 schema.xml 文件,指定使用 ikanalyzer 作为...
中文分词器ik-analyzer-solr5-5.x.jar,已经打包好,直接用就可以 2积分不黑心
目前在网上只能找到以前最老spring-data-solr 1.x.x 版本的配置和说明,最新版本的根本找不到,在参考spring-data-solr 官网文档后写的配置和小Demo,spring-data-solr 所使用的是目前最新版本的 spring-data-solr ...
1. `apache-solr-core-3.5.0.jar`: 这是Solr的核心库,包含了实现全文索引、查询、排序和结果高亮等功能的基础代码。其中,Solr服务器的核心功能如索引存储、查询处理、请求处理器和响应生成器都封装在这个JAR文件里...
1. **配置Solr服务器**:首先,将`apache-solr-dataimportscheduler-1.0.jar`添加到Solr服务器的`lib`目录下,确保服务器启动时能加载这个库。 2. **添加Scheduler配置**:在Solr的配置文件`solrconfig.xml`中,你...
"apache-solr-dataimportscheduler.jar" 是一个专门为Solr设计的扩展包,用于实现自动化的数据增量更新调度。 首先,我们要理解Solr的数据导入过程。Solr使用DataImportHandler(DIH)来从关系型数据库、XML文件或...
本文将深入探讨mmseg4j在Solr中的应用,以及如何在Solr 6.3版本中集成并使用mmseg4j-solr-2.4.0.jar这个库。 首先,mmseg4j是由李智勇开发的一个基于Java的中文分词工具,它的全称是“Minimum Match Segmentation ...
标题“ik-analyzer-solr7-7.x.zip”表明这是一个与Solr7相关的压缩包,其中包含了IK Analyzer,一个广泛使用的中文分词工具。这个压缩包特别为Solr7版本进行了优化,提供了完整的配置文件,使得用户可以方便地集成到...
"mmseg4j-solr-2.x.x-with-mmseg4j-core.zip"系列文件则代表了mmseg4j-solr的不同版本,其中x.x代表具体的版本号。这些版本间的差异主要在于对Solr的适应性、分词算法的优化以及可能新增的功能。升级或降级时,...
apache-solr-3.6.2.zipapache-solr-3.6.2.zipapache-solr-3.6.2.zipapache-solr-3.6.2.zipapache-solr-3.6.2.zipapache-solr-3.6.2.zipapache-solr-3.6.2.zip
1. **安装与配置**:将mmseg4j-solr-2.2.0的jar包添加到Solr的lib目录下,然后在Solr的schema.xml中配置分词器,指定使用mmseg4j-solr的分词算法。 2. **定制词典**:mmseg4j-solr允许用户自定义词典,以适应特定...
apache-solr-core-1.4.0.jar,apache-solr-core-1.4.0.jar
在压缩包"apache-solr-1.4.0"中,包含了Solr的源代码、配置文件、示例文档以及其他必要的资源。对于喜欢研究Solr的人来说,这些源代码是深入理解其工作原理、定制功能以及优化性能的重要资料。通过对这些源码的研究...
solr6.1.0版本jar已经不再提供读取自动索引配置文件路径的方法,因此apache-solr-dataimportscheduler-1.0内调用该方法的所有操作都无法实现。于是需要下载apache-solr-dataimportscheduler-1.0-with-source.jar并...
里面包含了mmseg4j-solr-2.0.0.jar,mmseg4j-solr-2.1.0.jar,mmseg4j-solr-2.2.0.jar,mmseg4j-solr-2.3.0.jar总共4个文件,其中: mmseg4j-solr-2.0.0.jar 要求 lucene/solr >= 4.3.0。在 lucene/solr [4.3.0, 4.7.1]...