`
fengshulin
  • 浏览: 41806 次
社区版块
存档分类
最新评论

Ubuntu14.04 solr5.0.0安装及配置IK中文分词

 
阅读更多

一、环境准备:

系统环境:ubuntu14.04

         tomcat 8.0.20

         jdk 1.8.0_40

         solr-5.0.0

二、安装solr

1、下载solr官网地址: http://apache.fayea.com/lucene/solr/5.0.0/

2、解压solr

      solin@solin:~/package$ tar -zxvf solr-5.0.0.tgz

3、进入solr-5.0.0/server/webapps并解压war包

      solin@solin:~/package$ cd /solr5.0/solr-5.0.0/server/webapps

      solin@solin:~/package$ jar -xvf solr.war

4、进入solr-5.0.0/server/webapps/WEB-INF,修改web.xml

      solin@solin:~/package$ cd solr-5.0.0/server/webapps/WEB-INF/

      solin@solin:~/package$ vim web.xml

      将env-entry注释放开,修改env-entry-value的文件路径

<env-entry>
       <env-entry-name>solr/home</env-entry-name>
       <env-entry-value>/solr-5.0.0/example/example-DIH/solr</env-entry-value>
       <env-entry-type>java.lang.String</env-entry-type>
</env-entry>

5、复制/solr-5.0.0/server/lib/ext下的jar包到/solr-5.0.0/server/webapps/WEB-INF/lib下

      solin@solin:~/package$ cp /solr-5.0.0/server/lib/ext/*.jar /solr-5.0.0/webapps/WEB-INF/lib

6、编辑tomcat server.xml

      solin@solin:~/package$ vim tomcat 8.0.20/config/server.xml

     

<Context path="/solr" docBase="/solr-5.0.0/server/webapps" reloadable="true" crossContext="true"/>

7、到此配置完成,重启tomcat

        solin@solin:~/package$ cd tomcat 8.0.20/bin/

        solin@solin:~/package$ ./startup.sh

8、浏览器访问http://localhost:8080/solr进入solr管理页面

三、solr将数据库做成索引数据源(mysql),solr5.0默认创建了datainport

1、修改数据源solr-data-config.xml(solr-5.0.0/example/example-DIH/solr/solr/conf/

<?xml version="1.0" encoding="UTF-8"?>  
<dataConfig>  
<dataSource type="JdbcDataSource" driver="com.mysql.jdbc.Driver"  
    url="jdbc:mysql://localhost:3306/lingcai"  
    user="root"  
    password="123456"/>  
  
<document name="article">           
    <entity name="article" query="select id,title,content,createtime from tab_article" transformer="ClobTransformer">                    
                <field column="id"      name="id"      /> 
		<field column="title"      name="title"      />
		<field column="content"      name="conten"      />
		<field column="createtime"      name="createtime"      />
    </entity>  
</document>  
</dataConfig>

2、将mysql驱动包放入/solr-5.0.0/webapps/WEB-INF/lib下

      附件下载

3、配置完成,创建索引:http://localhost:8080/solr/dataimport?command=full-import

4、查看是否导入成功:http://localhost:8080/solr/#/solr/query

四、配置IK中文分词

1、下载ik包,见附件

2、将ik包放入/solr-5.0.0/webapps/WEB-INF/lib下

3、编辑schema.xml文件,在文件中添加如下代码:

<!--filed-->
<field name="ik" type="text_ik" indexed="true" stored="true" multiValued="false" />    

<!--filedType-->
<fieldType name="text_ik" class="solr.TextField">    
    <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>    
</fieldType> 

 4、重启tomcat

 5、配置完成,进行测试:http://localhost:8080/solr/#/solr/analysis

五、solr索引数据备份 

1、备份solr数据文件分为两种方式:冷备份和热备份

      所谓冷备份就是指关闭solr,然后将SOLR_HOME/data下面的所有数据拷贝到一个安全的位置。这种方法简单,可靠,index数据文件不会产生不一致。但是缺点很明显,就是系统要关闭,如果数据量大的话,整个复制过程会比较长。

      热备份方法比较实用,也就是利用Solr Replication Handler!Replication Handler的主要作用是在一个load-balancing的solr部署架构中,将index数据复制到各个slave服务器上。但是,即使在没有任何slave服务器的情况下,Replication Handler也可以用来在主服务器上创建index的副本。

2、配置solrconfing.xml(Replication Handler

<requestHandler name="/replication" class="solr.ReplicationHandler" > 
       <lst name="master">
         <str name="replicateAfter">commit</str>
         <str name="replicateAfter">startup</str>
         <str name="confFiles">schema.xml,stopwords.txt</str>
       </lst>
        
       <lst name="slave">
         <str name="masterUrl">http://localhost:8088/solr/solr/replication</str>
         <str name="pollInterval">00:00:60</str>
       </lst>
</requestHandler>

3、重启系统,执行备份

<!--默认备份到solr/data下,文件类似snapshot.20131127105721594的目录,这目录就是备份出来的索引库-->
http://localhost:8080/solr/replication?command=backup 

<!--&location=/home/solin/document/solr/solr_bak,location代表指定备份地址-->
http://localhost:8088/solr/replication?command=backup&location=/home/solin/document/solr/solr_bak

4、solr索引恢复步骤

      (1)停止solr服务器

      (2)复制备份的索引到solr/data/index下

      (3)重启solr服务器

六、solr实现竞价排名

1、配置solrconfig.xml

<searchComponent name="elevator" class="solr.QueryElevationComponent" >
    <!-- pick a fieldType to analyze queries -->
    <str name="queryFieldType">string</str>
    <str name="config-file">elevate.xml</str>
  </searchComponent>

<!-- A request handler for demonstrating the elevator component -->
<requestHandler name="/elevate" class="solr.SearchHandler" startup="lazy">
    <lst name="defaults">
      <str name="echoParams">explicit</str>
      <str name="df">text</str>
    </lst>
    <arr name="last-components">
      <str>elevator</str>
    </arr>
</requestHandler>

2、配置elevate.xml

<elevate>
  <!--text为查询关键字-->
  <query text="测试"> 
  <!--id为竞价名次,配置越靠前搜索的排名越靠前-->
  <doc id="7141"/>
  <doc id="6916"/>    
  <doc id="6912"/>  
 </query>   
</elevate>

3、重启后,访问http://localhost:8088/solr/solr/elevate?q=测试&wt=json&indent=true

分享到:
评论
1 楼 dunkbird 2015-08-07  

你好,楼主。有问题想咨询一下,可否回答。
http://fengshulin.iteye.com/blog/2198619
这个文章的 ik分词的5.0.0版本是哪里来的,我看那个网上最新的是2012年的,最多支持到solr4。

相关推荐

    ubuntu14.04 Docker离线安装包

    在Ubuntu 14.04上安装Docker是许多系统管理员和开发者的需求,尤其是在没有互联网连接或者网络环境受限的情况下。Docker是一个开源的应用容器引擎,它允许开发者将他们的应用及其依赖打包到一个可移植的容器中,然后...

    Ubuntu 14.04安装配置NFS服务器

    Ubuntu 14.04 安装配置 NFS 服务器 NFS(Network File System)是一种允许多个电脑通过网络共享文件的系统。它使得不同的计算机可以通过网络访问和共享对方的文件,实现了文件的共享和交换。在 Ubuntu 14.04 中,...

    Ubuntu14.04离线安装NFS方法和安装包

    在Ubuntu 14.04上离线安装NFS涉及到几个关键步骤,包括理解NFS的基本概念、准备安装包、配置NFS服务器以及设置客户端。下面将详细介绍这个过程。 1. **NFS基本概念**:NFS由Sun Microsystems开发,是一种标准的...

    Ubuntu 14.04一步一步安装Openstack Kilo版本

    在Ubuntu 14.04上安装Openstack Kilo版本,是云计算领域工程师的一个重要实践,有助于了解并掌握Openstack这个开源云计算平台的搭建和使用。下面将详细介绍从系统安装到Openstack各个组件配置的全过程。 1. 安装...

    ubuntu14.04LTS离线安装openssh所需要的介质

    ubuntu14.04LTS离线安装openssh所需要的介质,亲测有效。

    在ubuntu14.04系统中安装indigo版本ROS的教程

    在Ubuntu 14.04系统中安装indigo版本ROS的教程内容涵盖了从系统软件源配置、添加ROS软件源、导入公钥、安装ROS不同版本到初始化rosdep和设置环境变量等多个方面。本文将详细介绍这些知识点。 首先,配置Ubuntu的...

    Ubuntu14.04中安装配置bochs详解

    Ubuntu14.04中安装配置bochs详解。亲自安装成功。

    虚拟机+Ubuntu 14.04安装方法

    6. 最终配置及优化:Ubuntu 14.04安装完成后,还可能需要对系统进行进一步的优化和配置。比如,更新系统软件包,安装必要的驱动程序,配置网络设置等。对于新手用户,可以参考网络上提供的教程或者文档来完成这些...

    ubuntu14.04 默认root登陆

    在 Ubuntu 14.04 中,默认情况下 root 帐号是禁用的,这是为了安全考虑。但是在某些情况下,我们需要使用 root 帐号来进行系统管理和维护。下面我们将介绍如何启用 root 帐号、如何在终端模式下切换到 root 身份,...

    Ubuntu 14.04 + caffe安装配置详细指南.docx

    .`Ubuntu 14.04 + caffe安装配置详细指南.docx

    Ubuntu 14.04版本 NFS 离线安装包

    在Ubuntu 14.04系统中,NFS(Network File ...完成以上步骤后,你应该已经在Ubuntu 14.04上成功安装了NFS服务,并配置好了一个可供其他机器访问的共享目录。确保在生产环境中考虑安全性和访问控制,避免不必要的风险。

    Ubuntu 14.04下NFS安装配置

    Ubuntu 14.04 下 NFS 安装配置 NFS(Network File System)是一种允许不同主机之间共享文件的网络文件系统。下面是 Ubuntu 14.04 下 NFS 安装配置的详细步骤: 安装 NFS 服务器 首先,需要安装 NFS 服务器。使用...

    ubuntu14.04安装gitlab.pdf

    Ubuntu 14.04 安装 GitLab 指南 GitLab 是一个用于仓库管理系统的开源项目,使用 Git 作为代码管理工具,并在此基础上搭建起来的 web 服务。它提供 Git 版本控制版本控制、代码检查、Bug 跟踪和 Wiki,它可以通过 ...

    四、ubuntu14.04+caffe环境安装1

    在本文中,我们将详细讨论如何在Ubuntu 14.04上配置Caffe环境,包括安装GCC 4.7、相关依赖、NVIDIA驱动以及CUDA。Caffe是一种高效的深度学习框架,广泛应用于图像识别和计算机视觉任务。由于Ubuntu 14.04自带的GCC...

    Ubuntu 14.04 64位镜像

    ........Ubuntu 14.04 64位Linux操作系统IOS镜像下载..........................................................................................................................................................

    mysql-ubuntu14.04系统版

    mysql-ubuntu14.04系统版

    ubuntu14.04-百度网盘分享下载

    复制文件内百度网盘分享地址ubuntu-14.04-desktop-amd64.iso

    Ubuntu14.04升级GCC4.9.3

    本文档详细介绍了在 Ubuntu 14.04 系统上升级 GCC 到 4.9.3 版本的步骤。GCC 是一个强大的编译器,支持 C++11 和 C++14 特性。在 Ubuntu 14.04 系统中,默认的 GCC 版本是 4.8.2,本文将指导用户如何升级到 4.9.3 ...

    Ubuntu14.04版本配置root登陆

    Ubuntu14.04版本配置root登陆,Ubuntu14.04版本配置root登陆

    在Ubuntu14.04上离线安装mysql5.7.19时需要的两个依赖包

    从mysql官网上下载mysql-server_5.7.21-1ubuntu14.04_amd64.deb-bundle.tar,然后进行离线安装,解压该安装包,会出现11个依赖包,按照顺序依次使用sudo dpkg -i 进行安装,中间会报错,显示缺少相应的依赖,具体...

Global site tag (gtag.js) - Google Analytics