- 浏览: 248722 次
- 性别:
- 来自: 深圳
-
文章分类
最新评论
-
sweed0:
为何每一段代码都重复一次呢?
spring注解实例二 -
Gary_Huangpf:
- - 插件报错啊
Ext前台分页 -
ddvk2007:
版主 我想請問你所說的mapreduce是hadoop的還是g ...
MapReduce中的Shuffle和Sort分析 -
人可木:
好问章,楼主写的相当详细。。。多谢。。。
findbugs插件的安装与应用 -
hautbbs:
按照博主的方法启动调试出现jvm terminated.Ex ...
10分钟学会使用MyEclipse断点调试js
一、字段配置(schema) schema.xml位于solr/conf/目录下,类似于数据表配置文件, 定义了加入索引的数据的数据类型,主要包括type、fields和其他的一些缺省设置。 1、先来看下type节点,这里面定义FieldType子节点,包括name,class,positionIncrementGap等一些参数。 必要的时候fieldType还需要自己定义这个类型的数据在建立索引和进行查询的时候要使用的分析器analyzer,包括分词和过滤,如下: 2、再来看下fields节点内定义具体的字段(类似数据库的字段),含有以下属性: 3、建议建立一个拷贝字段,将所有的 全文本 字段复制到一个字段中,以便进行统一的检索: 以下是拷贝设置: 4、动态字段,没有具体名称的字段,用dynamicField字段 如:name为*_i,定义它的type为int,那么在使用这个字段的时候,任务以_i结果的字段都被认为符合这个定义。如name_i, school_i schema.xml文档注释中的信息: 1、为了改进性能,可以采取以下几种措施: 2、<schema name="example" version="1.2"> 3、filedType <fieldType name="string" class="solr.StrField" sortMissingLast="true" omitNorms="true" /> 可选的属性: StrField类型不被分析,而是被逐字地索引/存储。 StrField和TextField都有一个可选的属性“compressThreshold”,保证压缩到不小于一个大小(单位:char) <fieldType name="text" class="solr.TextField" positionIncrementGap="100"> solr.TextField 允许用户通过分析器来定制索引和查询,分析器包括 一个分词器(tokenizer)和多个过滤器(filter) <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1"catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="1" /> 在分词和匹配时,考虑 "-"连字符,字母数字的界限,非字母数字字符,这样 "wifi"或"wi fi"都能匹配"Wi-Fi"。 <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true" /> 同义词 <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt"enablePositionIncrements="true" /> 在禁用字(stopword)删除后,在短语间增加间隔 stopword:即在建立索引过程中(建立索引和搜索)被忽略的词,比如is this等常用词。在conf/stopwords.txt维护。 4、fields <field name="id" type="string" indexed="true" stored="true" required="true" /> <field name="text" type="text" indexed="true" stored="false" multiValued="true" /> 包罗万象(有点夸张)的field,包含所有可搜索的text fields,通过copyField实现。 <copyField source="cat" dest="text" /> 在添加索引时,将所有被拷贝field(如cat)中的数据拷贝到text field中 作用: <dynamicField name="*_i" type="int" indexed="true" stored="true" /> 如果一个field的名字没有匹配到,那么就会用动态field试图匹配定义的各种模式。 <dynamicField name="*" type="ignored" multiValued="true" /> 如果通过上面的匹配都没找到,可以定义这个,然后定义个type,当String处理。(一般不会发生) 但若不定义,找不到匹配会报错。 5、其他一些标签 <uniqueKey>id</uniqueKey> 文档的唯一标识, 必须填写这个field(除非该field被标记required="false"),否则solr建立索引报错。 <defaultSearchField>text</defaultSearchField> 如果搜索参数中没有指定具体的field,那么这是默认的域。 <solrQueryParser defaultOperator="OR" /> 配置搜索参数短语间的逻辑,可以是"AND|OR"。 二、solrconfig.xml 1、索引配置 mainIndex 标记段定义了控制Solr索引处理的一些因素. useCompoundFile:通过将很多 Lucene 内部文件整合到单一一个文件来减少使用中的文件的数量。这可有助于减少 Solr 使用的文件句柄数目,代价是降低了性能。除非是应用程序用完了文件句柄,否则 2、查询处理配置 query标记段中以下一些与缓存无关的特性: query部分负责定义与在Solr中发生的时间相关的几个选项: 概念:Solr(实际上是Lucene)使用称为Searcher的Java类来处理Query实例。Searcher将索引内容相关的数据加载到内存中。根据索引、CPU已经可用内存的大小,这个过程可能需要较长的一段时间。要改进这一设计和显著提高性能,Solr引入了一张“温暖”策略,即把这些新的Searcher联机以便为现场用户提供查询服务之前,先对它们进行“热身”。 query中的智能缓存: 其中filterCache、queryResultCache、Named caches(如果实现了org.apache.solr.search.CacheRegenerator)可以自热。 每个缓存声明都接受最多四个属性: 对于所有缓存模式而言,在设置缓存参数时,都有必要在内存、cpu和磁盘访问之间进行均衡。统计信息管理页(管理员界面的Statistics)对于分析缓存的 hit-to-miss 比例以及微调缓存大小的统计数据都非常有用。而且,并非所有应用程序都会从缓存受益。实际上,一些应用程序反而会由于需要将某个永远也用不到的条目存储在缓存中这一额外步骤而受到影响。
false
的默认值应该就已经足够。
发表评论
-
solr服务器复制、服务器分发(shard)、Multicore(分片)配置,SolrJ的使用
2012-07-16 15:23 7315Solr服务器复制的配置 1,首先测试在本机上开启三个t ... -
Solr Replication(复制)是怎样工作的
2012-07-16 15:18 1179luence有一个 ... -
Solr Multicore 结合 Solr Distributed Searching 切分大索引来搜索
2012-07-13 17:58 944原文出处:http://blog.chenl ... -
solr学习资料收集
2012-07-13 17:57 1048学习新东西前,我一般都会先找些文章来看,整个原理呀 ... -
Searching过程详解
2012-07-11 11:41 10821.拦截请求,解析请求并构建相应的handler。 发送 ... -
solr的配置参数理解
2012-07-11 11:35 1064l dataDir参数 用于替换默认的索引数据目录(. ... -
DataImportHandler从数据库导入大量数据而内存溢出的问题
2012-07-11 11:33 1603Solr有个很方便的 ... -
Solr 3.5 + Tomcat7 + mmseg4j + 搜狗词库 -配置并运行
2012-07-11 11:22 1480这是我看到过的写的较好的一篇入门文章,个人觉得相对有些文章 ... -
solrj之二次开发
2012-07-11 11:19 1619Solrj已经是很强大的solr客户端了。它本身就包装了htt ... -
SOLR搭建企业搜索平台
2012-05-24 18:34 1815一、SOLR搭建企业搜索平台--MultiCore Solr ... -
solr理论
2012-05-24 17:11 10851、 solr基础 因为 Solr 包装并扩展了 Luc ... -
solr部署
2012-05-21 18:45 10111,从官方网站下载solr:apache-solr-3 ... -
lucene检索运算符
2012-05-05 13:05 1151lucene检索运算符: 1. “:” 指定字段查指定值 ... -
当前几个主要的Lucene中文分词器的比较
2012-01-05 15:36 14971. 基本介绍: paoding :Lucene ... -
全文检索lucene的使用和优化
2012-01-05 15:35 16651 lucene简介 1.1 什么是lucene L ... -
关于几种中文分词的比对
2011-12-06 09:34 1531目前lucene自身提供的StandardAnalyze ... -
lucene 索引 原理
2011-12-06 09:33 816Lucene是一个高性能的java ... -
lucene中QueryParser操作符的疑惑
2011-11-25 16:15 893在测试Lucene搜索时,对于 AND 与 + 的区别研 ... -
lucene学习资料收集
2011-11-25 16:09 817由于公司用到lucene,现对看到过的帮助较大的luce ... -
利用 Heritrix 构建特定站点爬虫
2011-11-25 15:41 866本文由浅入深,详细介绍了 Heritrix 在 Ecl ...
相关推荐
### Solrconfig.xml 和 Schema.xml 说明 #### Solrconfig.xml 概述 Solrconfig.xml 是 Apache Solr 的核心配置文件之一,主要用于定义 Solr 实例如何处理文档的索引与查询请求。该文件中包含了多种配置项,用于...
3. **配置与部署**:Solr的配置文件位于`conf`目录下,包括schema.xml(定义字段和字段类型)、solrconfig.xml(配置索引和查询参数)等。用户可以根据需求自定义这些配置。部署Solr通常涉及解压下载的`solr-4.10.3....
Solr的核心配置文件是`solrconfig.xml`和`schema.xml`,它们定义了索引的结构和处理查询的方式。 当你遇到404错误,首先检查Solr是否成功启动。查看日志文件(通常是`logs/solr.log`)以获取更详细的错误信息。如果...
每个核心有自己的配置,如字段类型、字段配置、搜索处理链等,这些都在`conf`目录下的`schema.xml`、`solrconfig.xml`等文件中定义。 此外,Solr还支持多种数据源的接入,例如文件系统、数据库等,通过数据驱动的...
在使用Solr-9.0.0时,你需要根据业务需求创建或修改配置文件,如`solrconfig.xml`和`schema.xml`,定义索引的字段类型和字段。然后可以通过POST请求将数据导入Solr,Solr会自动进行分词、建立倒排索引等操作,从而...
Solr,作为一款开源的全文搜索引擎,其核心配置文件包括`schema.xml`和`solrconfig.xml`,它们是Solr工作方式的基础。在深入理解这两个文件之前,我们需要先了解Solr的基本架构。 **1. Solr架构简介** Solr采用...
主要的配置文件位于 `solr-8.8.1/server/solr/configsets/_default/conf` 目录下,包括 `solrconfig.xml` 和 `schema.xml`。这些文件定义了索引和查询的行为。 启动 Solr 需要 Java 运行环境。确保已安装 Java 8 或...
5. **配置文件详解**:在压缩包中的 "solr-8.5.2" 文件夹下,你会找到一系列配置文件,如 `solrconfig.xml` 和 `schema.xml`。`solrconfig.xml` 定义了 Solr 的运行行为,包括数据导入、搜索处理链、请求处理器等;...
在 `server/solr/my_core/conf` 目录下,你可以找到并修改 Solr 的配置文件,如 `schema.xml` 定义字段类型和字段,`solrconfig.xml` 控制索引和查询行为。 6. **导入数据**: 使用 Solr 的 DataImportHandler ...
通过修改`solrconfig.xml`和`schema.xml`文件,可以定制Solr的行为,如设置搜索分析器、调整缓存策略等。 此外,Solr支持分布式搜索,通过SolrCloud模式可以在多个节点间实现数据复制、故障转移和负载均衡,这对于...
在部署和使用Solr时,你需要知道如何配置Solr核心(core)以满足你的需求,这可能涉及到创建和修改`solrconfig.xml`(配置文件)、`schema.xml`(定义字段和分析器)和`managed-schema`(在较新版本中,用于替代`...
5. **配置和优化**:根据你的需求,你可能需要自定义Solr配置,如修改`solrconfig.xml`(配置索引和查询行为)、`schema.xml`(定义字段和字段类型)等文件。此外,还可以配置复制和负载均衡策略以提高可用性。 6. ...
它是基于Java的,提供了高效、可扩展的全文检索、数据分析和分布式搜索功能。Solr-8.11.1是该软件的一个特定版本,包含了从早期版本到8.11.1的所有改进和修复。 在"solr-8.11.1.zip"这个压缩包中,用户可以找到Solr...
6. **server/solr 目录**:存储了配置集合的目录,每个集合都有自己的配置文件,如`schema.xml`用于定义字段和字段类型,`solrconfig.xml`定义了索引和查询的行为。 7. **contrib 目录**:包含了一些社区贡献的模块...
8. **配置文件**:虽然不是jar包,但Solr的配置文件如`solrconfig.xml`和`schema.xml`同样重要。前者定义了Solr服务器的行为,后者定义了索引的字段和类型。 9. **日志和监控**:Solr使用Log4j进行日志记录,`log4j...
配置文件(如`schema.xml`或`solrconfig.xml`)需要更新以指示Solr使用IKAnalyzer进行分词。JAR库文件(如`ik-analyzer.jar`)则需要添加到Solr的类路径中,以便在运行时能够加载和使用分词器。字典文件通常包含预定...
Solr 是一个基于 Lucene 的开源搜索引擎,专为全文检索、高效分析和处理大量数据而设计。本压缩包“solr7部署相关文件.zip”包含了部署 Solr 7.x 版本所需的所有关键组件和配置文件,使得用户可以快速搭建并运行 ...
- 配置文件位于`conf`目录下,如`schema.xml`用于定义字段和数据类型,`solrconfig.xml`用于配置索引和查询行为。 - 创建或导入数据可以通过Solr的API或使用Solr Admin界面完成。 5. **Solr的应用场景** - 电子...