`

solr学习-单机配置solr环境

    博客分类:
  • solr
 
阅读更多
转载http://www.douban.com/note/331756147/
windows linux mac安装过程都是类似的,jdk6和tomcat7的安装省略了,下面说明solr-4.7单机安装步骤
solr4.7是最后一个用jdk6的版本,从solr4.8开始用jdk7版本了

1.去apache官网下载solr-4.7,解压

4. slor安装至tomcat

a. 将该文件夹下面examples下的slor文件夹复制到f:\tomcat下面,作为solr的home目录
     该solr目录也可以不放在这,也可以单独放到其他目录,只要在下面d步骤中配置好即可

b. 将该文件夹下面webapps下的solr.war复制到tomcat的webapps目录下,war包在tomcat启动后会自动解压出来

c. 配置solr的data目录,打开f:/tomcat/solr/collection1/conf/solrconfig.xml,修改datadir:
引用
<dataDir>${solr.data.dir:F:\tomcat\solr\data}</dataDir>
 

d. 将solr.war注册给tomcat,在f:/tomcat/conf/Catalina/localhost/下创建solr.xml:
引用
<?xml version="1.0" encoding="UTF-8"?> 
 
<Context docBase="f:/tomcat/webapps/solr" debug="0" crossContext="true" > 
   <Environment name="solr/home" type="java.lang.String" value="f:/tomcat/solr" override="true" /> 
</Context>
 

e. 防止乱码的在tomcat/conf/server.xml中加入;
[html] view plaincopy
<Connector port="8080" protocol="HTTP/1.1" 
           connectionTimeout="20000" 
           redirectPort="8443"  
           URIEncoding="UTF-8"/> 

f. 将F:\solr\example\lib\ext下的5个jar包和F:\solr\example\resources下的log4j放入tomcat的lib目录下
g. 重新启动tomcat,浏览器中输入:http://localhost:8080/solr:

http://martin3000.iteye.com/blog/807503

中文分词器安装
   中文分词在solr里面是没有默认开启的,需要我们自己配置一个中文分词器。目前可用的分词器有smartcn,IK,jeasy,庖丁。其实主要是两种,一种是基于中科院ICTCLAS的隐式马尔科夫HMM算法的中文分词器,如smartcn,ictclas4j,优点是分词准确度高,缺点是不能使用用户自定义词库;另一种是基于最大匹配的分词器,如IK ,Jeasy,庖丁,优点是可以自定义词库,增加新词,缺点是分出来的垃圾词较多。各有优缺点,看应用场合自己衡量选择吧。

配置ik分词
将IK Analyzer 2012FF_hf1发行包解压,复制IKAnalyzer2012FF_u1.jar到Solr的lib中,如/home/tomcat/webapps/solr/WEB-INF/lib,复制配置文件IKAnalyzer.cfg.xml和ext_stopword.dic到/home/tomcat/webapps/solr/WEB-INF/classes目录中

打开solr/collection1/conf目录,编辑scheme.xml文件,添加下面xml代码
引用
<fieldType name="text_ik" class="solr.TextField">
       <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
       <analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
    </fieldType>

并且将该文件中的
引用
<field name="name" type="text_general" indexed="true" stored="true"/>

改成
引用
<field name="name" type="text_ik" indexed="true" stored="true"/>


在扩展词汇时修改IKAnalyzer.cfg.xml文件配置即可,注意修改文件stopword.dic,ext.dic的编码方式为无BOM的UTF-8编码方式
转载http://blog.csdn.net/shihuacai/article/details/8494360

配置SmartChinese分词
将contrib/analysis-extras/lucene-libs/lucene-smartcn-3.5.0.jar复制到/tomcat/webapps/solr/WEB-INF/lib,
打开/tomcat/bin/solr/conf/scheme.xml,编辑text字段类型如下,添加以下代码到shema中的相应位置,就是找到fieldType定义的那一段,在下面多添加
引用
<fieldType name="text" class="solr.TextField"> 
    <analyzer class="org.apahce.lucene.analysis.cn.smart.SmartChineseAnalyzer"/> 
</fieldType>
分享到:
评论

相关推荐

    solr单机-tools.zip

    Solr,全称为Apache Solr,...学习和掌握Solr单机部署及其工具,将有助于你更好地理解和利用Solr的强大搜索功能。在实际应用中,随着需求增长,你还可以探索SolrCloud,实现多节点集群部署,提供高可用性和水平扩展性。

    solr单机部署

    "Solr单机部署" Solr是一个全文检索服务器,它基于Lucene实现,Solr只需要进行配置就可以实现全文检索服务。Solr提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展,并对索引、搜索性能进行了优化。 1....

    windows-solr集群.docx

    ### Solr基础知识与单机配置详解 #### 一、Solr概述 - **定义**: Solr是Apache基金会下的一个顶级开源项目,它基于Lucene,提供了高性能的全文检索功能。Solr不仅支持复杂的查询语法,还具备高度的可配置性和扩展...

    solr7.4,linux单机、集群版搭建设置IK分词器

    2. **配置Solr集群**: - 在Solr的`bin`目录下执行`./solr cloud`命令,进入云模式。 - 使用`./solr create -c mycore -d /opt/solr/example/solr/collection1/conf`命令创建一个名为`mycore`的核心集合。 - 配置...

    SOLR HOME 相对路径配置

    这意味着所有相关的配置文件、索引和其他数据都会存放在`c:\solr-tomcat\solr`路径下。 第二种方法是**通过环境变量配置**。在Windows系统中,可以在系统环境变量中创建一个名为`solr.home`的新变量,其值设置为`c:...

    solr安装配置(单核、多核)

    9. 将 `solr-4.10.4\example\lib\ext` 目录下的所有 jar 包复制到 Tomcat 的 `webapps\solr\WEB-INF\lib` 目录。 10. 在 `WEB-INF` 目录下创建 `classes` 文件夹,并将 `log4j.properties` 文件从 Solr 示例资源...

    搭建好的solr 7.5单机版

    3. **Schema设计**:Solr的Schema.xml文件定义了字段类型和字段,这对于理解和配置Solr的索引结构至关重要。在Solr 7.5中,推荐使用动态字段和Schema API,以更加灵活和动态的方式管理字段。 4. **请求处理和插件**...

    windows版本的单机solr

    Solr依赖于Java环境,所以请确保你的系统环境变量`JAVA_HOME`已指向正确的JDK安装目录。接着,找到解压后的`bin`目录,这里包含了启动和管理Solr的相关脚本。 启动Solr服务,可以使用`bin\solr start`命令,这将...

    springboot-solr-demo:Solr单机版配置,以及springboot和solr集成

    springboot-solr-demoSolr单机版配置,以及springboot和solr集成solr-4.10.3solr4.10.31: 安装说明,以及中文词库配置说明等solr:webapp,将该目录放到tomcat webapps 下可以直接运行无需过多配置。solr-6.6.6solr...

    solr5.3.1集群搭建教程-线上环境搭建

    整个过程分为几个阶段:准备软件环境、部署单机版Tomcat 7 + Solr 5.2.1、配置多Tomcat实例以支持Solr集群以及最后配置ZooKeeper集群来确保Solr集群的稳定性和高可用性。 **软件需求:** - **Tomcat 7:** 版本...

    solrCloud5.2.1 + tomcat7 + zookeeper3.4.6

    解压`solr-5.2.1.tgz`,复制`solr-5.2.1\example\example-DIH\solr`下的`solr`文件夹和`solr.xml`至`solr_home_1\home`目录。 3. 创建`solr_home_1`文件夹,在其内创建`home`和`server`子目录。 4. 将`solr-5.2.1...

    solr-7.3.0 linux版本亲测可用.zip

    此“solr-7.3.0 linux版本亲测可用.zip”压缩包文件提供了Solr 7.3.0在Linux环境下的安装包,确保了在Linux操作系统上的兼容性和稳定性。 在Solr 7.3.0中,包含了以下关键知识点: 1. **SolrCloud模式**:Solr ...

    快速上手数据挖掘之solr搜索引擎高级教程(Solr集群、KI分词)第04讲 solr5单机安装与配置 共10页.pptx

    【课程大纲】第01讲 solr5简介第02讲 solr5之Schema第03讲 solr5之Solrconfig第04讲 solr5单机安装与配置第05讲 solrj基础(一)第06讲 solrj基础(二)第07讲 solrj之SolrBean第08讲 solrj语法详解第09讲 Solrj之...

    solr-4.10.3

    "solr-4.10.3"版本中的配置文件将帮助我们了解如何设置这些参数。部署时,可以单机运行,也可以通过SolrCloud实现分布式部署,后者利用Zookeeper进行集群管理和数据协调。 4. **数据导入导出**:Solr支持多种数据源...

    solr文档.docx

    - 安装Solr单机版后,将solr-5.5.3目录下的dist和contrib文件夹复制到Solr home目录下,暂时不创建Core。 **3. 将Solr与ZooKeeper关联** - 修改每台Solr服务器的`solr.in.sh`文件,添加以下行以指定ZooKeeper...

    快速上手数据挖掘之solr搜索引擎高级教程(Solr集群、KI分词)第11讲 Solr集群安装与配置(二) 共10页.pptx

    【课程大纲】第01讲 solr5简介第02讲 solr5之Schema第03讲 solr5之Solrconfig第04讲 solr5单机安装与配置第05讲 solrj基础(一)第06讲 solrj基础(二)第07讲 solrj之SolrBean第08讲 solrj语法详解第09讲 Solrj之...

    快速上手数据挖掘之solr搜索引擎高级教程(Solr集群、KI分词)第10讲 Solr集群安装与配置(一) 共10页.pptx

    【课程大纲】第01讲 solr5简介第02讲 solr5之Schema第03讲 solr5之Solrconfig第04讲 solr5单机安装与配置第05讲 solrj基础(一)第06讲 solrj基础(二)第07讲 solrj之SolrBean第08讲 solrj语法详解第09讲 Solrj之...

    Solr开发指南.pdf

    配置SolrCore时,需要创建相应的目录结构,并配置solrconfig.xml和schema.xml文件来定义索引结构和搜索行为。 【Solr入门】 - Schema配置:Schema是Solr的核心配置之一,用于定义字段类型和字段,影响索引和搜索...

Global site tag (gtag.js) - Google Analytics