`
jaymsimusic
  • 浏览: 94558 次
  • 性别: Icon_minigender_1
  • 来自: 苏州
社区版块
存档分类
最新评论

SOLR安装与配置

    博客分类:
  • solr
阅读更多
SOLR安装与配置
我用的是 Solr3.3

安装前准备
Java 1.5 或更高版本
servlet 容器,如 Tomcat 5.5。

SOLR安装

     将SOLR发行包解压,复制dist/apache-solr-3.3.0.war到指定目录,例如c:/solr

TOMCAT配置

server.xml
     在server.xml主要设置侦听端口。一般来说,SOLR常用端口为8983。你也可以使用自己喜欢的端口,例如80或8080。 同时,注意将URIEncoding设置为UTF-8。例如AJP等更多Native优化,参考TOMCAT优化方案。
<Connector port="8983" maxHttpHeaderSize="8192" 
maxThreads="150" minSpareThreads="25" maxSpareThreads="75" 
enableLookups="false" redirectPort="8443" acceptCount="100" 
connectionTimeout="20000" disableUploadTimeout="true" URIEncoding="UTF-8" />


solr.xml
     新增solr.xml在{$TOMCAT}/conf/Catalina/localhost/下。TOMCAT在启动时将自动加载该CONTEXT。 docBase应设置为solr war包存放位置,例如c:/solr/apache-solr-3.3.0.war
     solr/home的值应设置为你规划存放的索引根路径,例如/web/solr/。该目录在以下将称为{$SOLR_HOME}

<Context docBase="c:/solr/apache-solr-3.3.0.war" debug="0" crossContext="true" > 
<Environment name="solr/home" type="java.lang.String" value="/web/solr" override="true" /> 
</Context>


SOLR配置

把solr包里面的example\solr文件夹下面的所有文件放入到 {$SOLR_HOME}里面

庖丁分词包安装与设置
      solr3.3+庖丁分词器paoding的例子,paoding分词器,最新的JAR文件为paoding-analysis-2.0.4-beta,不支持lucene3.0以上版本,作者提供了支持lucene3.0以上版本的源码,但没有打成JAR包发布。附件里有编译好的源码,支持lucene3.0以上版本,同时还添加了一个类,该类的作用是让庖丁分词器支持solr。
添加的类文件如下:
package net.paoding.analysis.analyzer.solr;

import java.io.Reader;
import java.util.Map;

import net.paoding.analysis.analyzer.PaodingTokenizer;
import net.paoding.analysis.analyzer.TokenCollector;
import net.paoding.analysis.analyzer.impl.MaxWordLengthTokenCollector;
import net.paoding.analysis.analyzer.impl.MostWordsTokenCollector;
import net.paoding.analysis.knife.PaodingMaker;

import org.apache.lucene.analysis.Tokenizer;
import org.apache.solr.analysis.BaseTokenizerFactory;

/**
 * 实现Solr3.2分词器接口
 * 基于PaodingTokenizer的实现
 * 
 * @author sunlightcs
 * 
 * http://hi.juziku.com/sunlightcs/
 *
 */
public class ChineseTokenizerFactory extends BaseTokenizerFactory{
	/** 
     * 最多切分
     */  
    public static final String MOST_WORDS_MODE = "most-words";  
  
    /** 
     * 按最大切分 
     */  
    public static final String MAX_WORD_LENGTH_MODE = "max-word-length";  
  
    private String mode = null;  
    
    private TokenCollector tokenCollector = null;
  
    
    public void init(Map<String,String> args) {  
        setMode(args.get("mode"));
    }
  
    public Tokenizer create(Reader input) {  
        return new PaodingTokenizer(input, PaodingMaker.make(), tokenCollector);  
    }
    
    /**
     * 默认按最多切分
     */
    public void setMode(String mode) {  
        if (mode == null || "default".equalsIgnoreCase(mode) || MOST_WORDS_MODE.equalsIgnoreCase(mode)) {  
        	tokenCollector = new MostWordsTokenCollector();  
        } else {  
        	tokenCollector = new MaxWordLengthTokenCollector();  
        }
    }
}

已经将该类文件与paoding源码打包成了paoding-analysis3.0.jar文件,附件里有下载。


在使用庖丁分词器时,要从http://code.google.com/p/paoding/处下载词典及配置文件。 其中,paoding-dic-home.properties配置文件里,要指定词典的路径,如果词典放在classes目录下面,则词典的路径为:paoding.dic.home=classpath:dic

将这些配置文件及词典paoding-analysis-2.0.4-beta\dic 放到apache-solr3.3.0/WEB-INF/lib/classes目录下,并将paoding-analysis3.0.jar放到apache-solr3.3.0/WEB-INF/lib目录里。

然后在solr中加入paoding分词器,打开 schema.xml文件,位置:solr/home/conf/ schema.xml

<fieldType name="text" class="solr.TextField" positionIncrementGap="100">  
      <analyzer type="index">  
<!-- 使用paoding分词器,按最多切分 mode="most-words"这个是在上面哪个类里定义好的。-->
        <tokenizer class="net.paoding.analysis.analyzer.solr.ChineseTokenizerFactory" mode="most-words"/>  
      ··· ···  
      </analyzer>  
      <analyzer type="query">  
         <tokenizer class="net.paoding.analysis.analyzer.solr.ChineseTokenizerFactory" mode="most-words"/>   
        ··· ···  
      </analyzer>  
</fieldType>  



http://localhost:8080/solr
分享到:
评论

相关推荐

    solr安装与配置

    #### 三、Solr配置细节 ##### 1. 配置核心 - **配置核心信息**:每个索引都需要一个核心(Core),核心是Solr的一个实例,包含一个或多个索引。在`D:\Solr\solr1\home`目录下,可以通过编辑`core.properties`文件来...

    Solr安装与配置

    本文将详细介绍如何进行 Solr 的安装与配置。 首先,安装 Solr 需要先确保你的系统已经安装了 Java Development Kit (JDK) 1.6 或以上版本,因为 Solr 需要依赖 JDK 来运行。你可以从 Oracle 的官方网站下载并安装...

    Solr安装与配置solr.rar

    本压缩包“Solr安装与配置solr.rar”包含了Solr的安装和配置步骤,对于理解和使用Solr进行全文检索、索引和查询操作具有重要的参考价值。 首先,我们需要了解Solr的基本架构。Solr的核心组件包括索引库、请求处理器...

    Solr配置安装(一)

    Solr配置安装(一) Apache Solr是一款基于Java的开源搜索服务器,由Apache软件基金会开发。它提供了全文检索、命中高亮、拼写检查、实时索引和多种数据类型支持等强大功能,常用于构建高性能的搜索应用。本文将...

    solr安装到Linux系统

    在Linux系统上如何搭建了solr搜索服务,同时运用到项目中

    solr安装配置

    总的来说,Solr 的安装和配置涉及到 JDK、Tomcat 的安装与环境变量设置,以及 Solr 核心的创建、配置和数据的导入。在实际操作中,需要注意路径的正确性,字符集的设置,以及索引字段与分词文件的一致性,这些都是...

    solr安装和介绍

    ### Solr 安装与配置详解 #### 一、Solr 概述 Apache Solr 是一款开源的、高性能的企业级搜索平台,基于 Lucene 库构建而成。它提供了高度可伸缩性的全文检索功能,并支持多种语言。Solr 被广泛应用于企业级搜索...

    Tomcat和solr安装配置说明

    Tomcat和solr安装配置说明,详细记录了Tomcat和solr安装配置

    solr搜索服务器安装配置

    #### 二、Solr的安装与配置 ##### 2.1 安装准备 在进行Solr的安装之前,需要准备以下环境: - **操作系统**:推荐使用Linux系统,如CentOS 7.x。 - **JDK版本**:确保已安装JDK 8或更高版本,因为Solr依赖于Java运行...

    solr4.1安装配置

    3. **修改Solr配置**: - 在`$SOLR_HOME/collection1/conf/schema.xml`文件中,在`&lt;types&gt;&lt;/types&gt;`之间添加以下内容: ```xml &lt;fieldType name="text_ik" class="solr.TextField"&gt; ``` - 同时,修改`...

    solr安装配置(单核、多核)

    本篇将详细介绍如何在本地环境中安装并配置 Solr,包括单核心(core)和多核心的设置。 **一、Solr 单核心安装配置** 1. 首先,我们需要从 Apache Tomcat 官网下载 Tomcat,这将作为 Solr 的服务器容器。Tomcat ...

    solr配置放啊

    数据源配置是Solr配置中的关键部分之一,它决定了Solr如何与外部数据源交互。下面是对提供的XML配置示例的详细解析: ```xml driver="com.microsoft.sqlserver.jdbc.SQLServerDriver" url="jdbc:sqlserver://27....

    全文搜索技术solr Demo

    本Demo将带你深入理解Solr的工作原理,并通过实际操作来熟悉其配置与使用。 一、Solr简介 Solr是基于Lucene的开源全文搜索引擎服务器,它提供了索引、搜索、排序、高亮显示等核心功能。Solr支持多种数据源,如XML、...

    solr5.5.4项目示例

    1. **Solr安装与配置**:首先,你需要下载Solr 5.5.4版本,并解压到本地文件系统。然后,启动Solr服务器,通常通过运行`bin/solr start`命令。你需要配置Solr的`solrconfig.xml`和`schema.xml`文件,定义索引字段和...

    solr服务器的搭建

    三、Solr安装与配置 1. 解压Solr 4.10.3的压缩包。 2. 将 `dist/solr-4.10.3.war` 文件部署到Tomcat的 `webapps` 目录下。这可以通过将war文件复制到 `/usr/local/tomcat/webapps` 来完成。 3. 运行Tomcat以解压缩...

    solr配置与安装

    Solr的配置和安装: 1. 创建一个solr的文件夹作为服务器的位置,里面再建两个文件夹一个home文件夹一个server文件夹。 2. home文件夹中存放apache-solr-3.6.0\example\solr中的所有文件,删除data中所有的数据,...

    tomcat和solr的配置安装过程

    "Tomcat 和 Solr 的配置安装过程" 在本文中,我们将详细介绍 Tomcat 和 Solr 的配置安装过程。Tomcat 是一个开源的 Web 服务器软件,而 Solr 是一个基于 Lucene 的搜索服务器。它们都是 Java 语言开发的,因此可以...

    图解Solr5.3.1与MySQL配置【原创】

    ### 图解Solr5.3.1与MySQL配置详解 #### 一、Solr与MySQL集成概述 在本文中,我们将详细介绍如何配置Solr 5.3.1与MySQL数据库的集成,以便实现高效的数据搜索功能。Solr是一款高性能、可伸缩的企业级搜索引擎,它...

Global site tag (gtag.js) - Google Analytics