SOLR安装与配置
我用的是 Solr3.3
安装前准备
Java 1.5 或更高版本
servlet 容器,如 Tomcat 5.5。
SOLR安装
将SOLR发行包解压,复制dist/apache-solr-3.3.0.war到指定目录,例如c:/solr
TOMCAT配置
server.xml
在server.xml主要设置侦听端口。一般来说,SOLR常用端口为8983。你也可以使用自己喜欢的端口,例如80或8080。 同时,注意将URIEncoding设置为UTF-8。例如AJP等更多Native优化,参考TOMCAT优化方案。
<Connector port="8983" maxHttpHeaderSize="8192"
maxThreads="150" minSpareThreads="25" maxSpareThreads="75"
enableLookups="false" redirectPort="8443" acceptCount="100"
connectionTimeout="20000" disableUploadTimeout="true" URIEncoding="UTF-8" />
solr.xml
新增solr.xml在{$TOMCAT}/conf/Catalina/localhost/下。TOMCAT在启动时将自动加载该CONTEXT。 docBase应设置为solr war包存放位置,例如c:/solr/apache-solr-3.3.0.war
solr/home的值应设置为你规划存放的索引根路径,例如/web/solr/。该目录在以下将称为{$SOLR_HOME}
<Context docBase="c:/solr/apache-solr-3.3.0.war" debug="0" crossContext="true" >
<Environment name="solr/home" type="java.lang.String" value="/web/solr" override="true" />
</Context>
SOLR配置
把solr包里面的example\solr文件夹下面的所有文件放入到 {$SOLR_HOME}里面
庖丁分词包安装与设置
solr3.3+庖丁分词器paoding的例子,paoding分词器,最新的JAR文件为paoding-analysis-2.0.4-beta,不支持lucene3.0以上版本,作者提供了支持lucene3.0以上版本的源码,但没有打成JAR包发布。附件里有编译好的源码,支持lucene3.0以上版本,同时还添加了一个类,该类的作用是让庖丁分词器支持solr。
添加的类文件如下:
package net.paoding.analysis.analyzer.solr;
import java.io.Reader;
import java.util.Map;
import net.paoding.analysis.analyzer.PaodingTokenizer;
import net.paoding.analysis.analyzer.TokenCollector;
import net.paoding.analysis.analyzer.impl.MaxWordLengthTokenCollector;
import net.paoding.analysis.analyzer.impl.MostWordsTokenCollector;
import net.paoding.analysis.knife.PaodingMaker;
import org.apache.lucene.analysis.Tokenizer;
import org.apache.solr.analysis.BaseTokenizerFactory;
/**
* 实现Solr3.2分词器接口
* 基于PaodingTokenizer的实现
*
* @author sunlightcs
*
* http://hi.juziku.com/sunlightcs/
*
*/
public class ChineseTokenizerFactory extends BaseTokenizerFactory{
/**
* 最多切分
*/
public static final String MOST_WORDS_MODE = "most-words";
/**
* 按最大切分
*/
public static final String MAX_WORD_LENGTH_MODE = "max-word-length";
private String mode = null;
private TokenCollector tokenCollector = null;
public void init(Map<String,String> args) {
setMode(args.get("mode"));
}
public Tokenizer create(Reader input) {
return new PaodingTokenizer(input, PaodingMaker.make(), tokenCollector);
}
/**
* 默认按最多切分
*/
public void setMode(String mode) {
if (mode == null || "default".equalsIgnoreCase(mode) || MOST_WORDS_MODE.equalsIgnoreCase(mode)) {
tokenCollector = new MostWordsTokenCollector();
} else {
tokenCollector = new MaxWordLengthTokenCollector();
}
}
}
已经将该类文件与paoding源码打包成了paoding-analysis3.0.jar文件,附件里有下载。
在使用庖丁分词器时,要从http://code.google.com/p/paoding/处下载词典及配置文件。 其中,paoding-dic-home.properties配置文件里,要指定词典的路径,如果词典放在classes目录下面,则词典的路径为:paoding.dic.home=classpath:dic
将这些配置文件及词典paoding-analysis-2.0.4-beta\dic 放到apache-solr3.3.0/WEB-INF/lib/classes目录下,并将paoding-analysis3.0.jar放到apache-solr3.3.0/WEB-INF/lib目录里。
然后在solr中加入paoding分词器,打开 schema.xml文件,位置:solr/home/conf/ schema.xml
<fieldType name="text" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<!-- 使用paoding分词器,按最多切分 mode="most-words"这个是在上面哪个类里定义好的。-->
<tokenizer class="net.paoding.analysis.analyzer.solr.ChineseTokenizerFactory" mode="most-words"/>
··· ···
</analyzer>
<analyzer type="query">
<tokenizer class="net.paoding.analysis.analyzer.solr.ChineseTokenizerFactory" mode="most-words"/>
··· ···
</analyzer>
</fieldType>
http://localhost:8080/solr
分享到:
相关推荐
#### 三、Solr配置细节 ##### 1. 配置核心 - **配置核心信息**:每个索引都需要一个核心(Core),核心是Solr的一个实例,包含一个或多个索引。在`D:\Solr\solr1\home`目录下,可以通过编辑`core.properties`文件来...
本文将详细介绍如何进行 Solr 的安装与配置。 首先,安装 Solr 需要先确保你的系统已经安装了 Java Development Kit (JDK) 1.6 或以上版本,因为 Solr 需要依赖 JDK 来运行。你可以从 Oracle 的官方网站下载并安装...
本压缩包“Solr安装与配置solr.rar”包含了Solr的安装和配置步骤,对于理解和使用Solr进行全文检索、索引和查询操作具有重要的参考价值。 首先,我们需要了解Solr的基本架构。Solr的核心组件包括索引库、请求处理器...
Solr配置安装(一) Apache Solr是一款基于Java的开源搜索服务器,由Apache软件基金会开发。它提供了全文检索、命中高亮、拼写检查、实时索引和多种数据类型支持等强大功能,常用于构建高性能的搜索应用。本文将...
在Linux系统上如何搭建了solr搜索服务,同时运用到项目中
总的来说,Solr 的安装和配置涉及到 JDK、Tomcat 的安装与环境变量设置,以及 Solr 核心的创建、配置和数据的导入。在实际操作中,需要注意路径的正确性,字符集的设置,以及索引字段与分词文件的一致性,这些都是...
### Solr 安装与配置详解 #### 一、Solr 概述 Apache Solr 是一款开源的、高性能的企业级搜索平台,基于 Lucene 库构建而成。它提供了高度可伸缩性的全文检索功能,并支持多种语言。Solr 被广泛应用于企业级搜索...
Tomcat和solr安装配置说明,详细记录了Tomcat和solr安装配置
#### 二、Solr的安装与配置 ##### 2.1 安装准备 在进行Solr的安装之前,需要准备以下环境: - **操作系统**:推荐使用Linux系统,如CentOS 7.x。 - **JDK版本**:确保已安装JDK 8或更高版本,因为Solr依赖于Java运行...
3. **修改Solr配置**: - 在`$SOLR_HOME/collection1/conf/schema.xml`文件中,在`<types></types>`之间添加以下内容: ```xml <fieldType name="text_ik" class="solr.TextField"> ``` - 同时,修改`...
本篇将详细介绍如何在本地环境中安装并配置 Solr,包括单核心(core)和多核心的设置。 **一、Solr 单核心安装配置** 1. 首先,我们需要从 Apache Tomcat 官网下载 Tomcat,这将作为 Solr 的服务器容器。Tomcat ...
数据源配置是Solr配置中的关键部分之一,它决定了Solr如何与外部数据源交互。下面是对提供的XML配置示例的详细解析: ```xml driver="com.microsoft.sqlserver.jdbc.SQLServerDriver" url="jdbc:sqlserver://27....
本Demo将带你深入理解Solr的工作原理,并通过实际操作来熟悉其配置与使用。 一、Solr简介 Solr是基于Lucene的开源全文搜索引擎服务器,它提供了索引、搜索、排序、高亮显示等核心功能。Solr支持多种数据源,如XML、...
1. **Solr安装与配置**:首先,你需要下载Solr 5.5.4版本,并解压到本地文件系统。然后,启动Solr服务器,通常通过运行`bin/solr start`命令。你需要配置Solr的`solrconfig.xml`和`schema.xml`文件,定义索引字段和...
三、Solr安装与配置 1. 解压Solr 4.10.3的压缩包。 2. 将 `dist/solr-4.10.3.war` 文件部署到Tomcat的 `webapps` 目录下。这可以通过将war文件复制到 `/usr/local/tomcat/webapps` 来完成。 3. 运行Tomcat以解压缩...
Solr的配置和安装: 1. 创建一个solr的文件夹作为服务器的位置,里面再建两个文件夹一个home文件夹一个server文件夹。 2. home文件夹中存放apache-solr-3.6.0\example\solr中的所有文件,删除data中所有的数据,...
"Tomcat 和 Solr 的配置安装过程" 在本文中,我们将详细介绍 Tomcat 和 Solr 的配置安装过程。Tomcat 是一个开源的 Web 服务器软件,而 Solr 是一个基于 Lucene 的搜索服务器。它们都是 Java 语言开发的,因此可以...
### 图解Solr5.3.1与MySQL配置详解 #### 一、Solr与MySQL集成概述 在本文中,我们将详细介绍如何配置Solr 5.3.1与MySQL数据库的集成,以便实现高效的数据搜索功能。Solr是一款高性能、可伸缩的企业级搜索引擎,它...