`
Dmingming
  • 浏览: 2244 次
  • 性别: Icon_minigender_2
  • 来自: 杭州
社区版块
存档分类
最新评论

tomcat + solr + IK 全过程

阅读更多
solr初触,在用jetty跑通以后,开始在tomcat下进行配置。
首先,下载最新版的solr ,http://apache.dataguru.cn/lucene/solr/4.2.1/

1:将dist目录下的solr-4.2.0.war 复制到tomcat 下的webapps根目录,重命名为solr.war,运行tomcat,solr.war被解压。

2:在tomcat根目录(可以是任何目录)新建文件目录solr/home,将solr-4.1.0\example下的solr复制到solr/home目录下,如果要配置多核,只用复制solr-4.1.0\example\multicore下的core0、core1、solr.xml复制到solr/home

3: 找到 webapps\solr\WEB-INF下的web.xml,配置solr/home信息
    <env-entry>
       <env-entry-name>solr/home</env-entry-name>
       <env-entry-value>D:/apache-tomcat-7.0.34/solr/home</env-entry-value>
       <env-entry-type>java.lang.String</env-entry-type>
    </env-entry>


到这里,就可以测试一下了.运行tomcat,访问http://127.0.0.1:端口号/solr/admin
如果看到solr的主页面,并且没有错误信息,说明已经配置成功。


如此,我们来进行更细致的配置
4:上面有提到多核,配置如下。
复制solr-4.1.0\example\multicore下的core0、core1、solr.xml复制到solr/home,找开
solr.xml,找到cores标签,默认的配置是core 0、core1.可根据需求进行修改,我
有如下两个业务,需要两个不同的core,如下配置。
  <cores adminPath="/admin/cores" host="${host:}" hostPort="${jetty.port:}">
    <core name="EMAIL" instanceDir="email" />
    <core name="IM" instanceDir="im" />
  </cores>

其中,name就是我们访问时的名称,instanceDir为solr/home下的core0、core1,这里作相应的修改

重启tomcat,访问http://127.0.0.1:8089/solr/#/EMAIL
http://127.0.0.1:8089/solr/#/IM  进行测试[/color]

其中,solr/home/EMAIL与IM下,最重要的文件就是schama.xml,所以的索引字段都在这里面进行配置,主要有两个标签<field> 与 <fieldType>
    <schema name="im core im" version="1.1">
        <types>

<fieldtype name="string"  class="solr.StrField" sortMissingLast="true" omitNorms="true"/>
<fieldType name="text_cn" class="solr.TextField">
<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>
    </types>
    <fields>
   <field name="id" type="int" indexed="true" stored="true" multiValued="false"/>
   <field name="name" type="text_cn" indexed="true" stored="true" multiValued="true"/>
   <field name="city" type="text_cn" indexed="true" stored="true" multiValued="true"/>
   </fields>

其中,库名要与当前的库名匹配<schema name="im core im" version="1.1">, indexed是否建索引,stored是否保存,multiValued是否多个值,根据具体的需求进行配置。


5:上面有个name="text_cn"的类型,这个就是接下来要进行的分词。
我选择了IK分词器。在配置的过程中,遇到一个问题:
java.lang.VerifyError: class org.wltea.analyzer.lucene.IKAnalyzer overrides final method tokenStream.(Ljava/lang/String;Ljava/io/Reader;)Lorg/apache/lucene/analysis/TokenStream;


原因是我最开始用的是IK3.2.8  与 当前solr的版本冲突。重新下载 2012 ff 后问题得到解决。下载地址为:http://code.google.com/p/ik-analyzer/downloads/detail?name=IK%20Analyzer%202012FF_hf1.zip&can=2&q=


将IKAnalyzer2012FF_u1.jar拷贝到D:\apache-tomcat-7.0.34\webapps\solr\WEB-INF\lib目录下;
IKAnalyzer.cfg.xml(分词器扩展配置文件)与stopword.dic(扩展的stopword词典,3.2以上版本提供)文件放置在代码根目录(对于web项目,通常是WEB-INF/classes目录,同hibernate、log4j等配置文件相同)下即可.


重启tomcat,进入http://127.0.0.1:8089/solr/#/EMAIL/analysis  (IM同)输入如:“我是美女屌丝程序员”进行测试。










[/size][/color]
分享到:
评论

相关推荐

    tomcat8+solr7.4+IK

    【标题】"Tomcat8+Solr7.4+IK"是一个在Linux环境下搭建的搜索引擎解决方案,其中包含了Apache Tomcat 8作为应用服务器,Solr 7.4作为搜索引擎核心,以及IK Analyzer作为中文分词工具。这个配置适用于需要处理大量...

    tomcat8.5+solr7+IKAnalyzer5

    标题"tomcat8.5+solr7+IKAnalyzer5"指出这是一个集成项目,其中包含了三个关键组件:Tomcat 8.5版本,Solr 7版本,以及IKAnalyzer 5版本。Tomcat是Apache软件基金会的一个开源项目,用作Java Servlet和JavaServer ...

    tomcat8.5+solr7+IKAnalyzer5+ikpinyin直装版

    【标题】"tomcat8.5+solr7+IKAnalyzer5+ikpinyin直装版" 提供了一个集成的搜索引擎环境,其中包含了Tomcat 8.5作为应用服务器,Solr 7作为核心搜索引擎,以及IKAnalyzer5和ikpinyin这两个中文分词插件。这个组合特别...

    window下tomcat+solr整合

    标题中的“window下tomcat+solr整合”指的是在Windows操作系统环境下,将Apache Tomcat(一个流行的Java Servlet容器)与Apache Solr(一个基于Lucene的全文搜索服务器)进行集成,以便实现高效的全文检索功能。...

    tomcat8.5+jdk1.8+solr7.0.0+ik7.X+mysql5.7整合

    整合了tomcat和solr,和ik分词器 里面有对应JAR包 然后也连接了数据库,用得时候记得改data-config.xml 里面你得数据库地址和密码!!还有managed-schema这个里面得对应字段得名称和类型

    tomcat-8.0.28+solr5.3.1安装教程.doc

    ### Tomcat 8.0.28 + Solr 5.3.1 安装教程 #### 一、JDK 下载与安装 1. **下载** ...对于64位操作系统,建议下载...在实际操作过程中,需要注意环境变量的正确配置、Tomcat 端口的调整以及 Solr 的正确部署等关键环节。

    tomcat+solr3.6+mmseg4j

    【标题】"Tomcat+Solr3.6+MMSEG4J"整合及应用实例 在Web开发领域,搜索引擎和全文检索功能变得越来越重要。Apache Solr作为一个强大的、开源的企业级搜索平台,常被用于构建高效、可扩展的搜索解决方案。而Tomcat...

    linux+tomcat+mysql+solr调优

    ### Linux + Tomcat + MySQL + Solr ...综上所述,Linux、Tomcat、MySQL和Solr的调优是一个复杂的过程,需要结合具体的应用场景进行细致的分析与调整。希望以上提供的配置项和建议能帮助您更好地优化这些组件的性能。

    tomcat9 + solr

    标题 "Tomcat9 + Solr" 提示我们讨论的是如何在Apache Tomcat 9服务器上部署和运行Apache Solr搜索引擎。Solr是一个基于Java的开源全文搜索引擎,它提供了高效的索引和搜索功能,广泛用于企业级的信息检索系统。...

    ssm+shiro+solr7+mybatis逆向+maven多项目初步搭建测试

    几乎全新搭建ssm+shiro+solr7+mybatis逆向+maven多项目初步搭建测试,只是大致框架,接下来自己写,下面是linux 下solr7+tomcat8+IK中文分词器 环境 https://download.csdn.net/download/laysolitary/10686971

    tomcat8+solr7直装版

    【整合过程】:在“Tomcat8+Solr7直装版”中,Tomcat作为Solr的服务器环境,已经配置好Solr的核心服务,用户无需手动配置Solr服务器或设置上下文路径。通常,这会涉及到在Tomcat的webapps目录下放置Solr的WAR文件,...

    tomcat9.0 + solr7.5.zip

    tomcat9.0 + solr7.5 ,修改solr默认服务器jetty 为tomcat 。访问http://localhost:8080/solr/index.html/ 显示404,莫名奇妙。最后怀疑是web.xml文件有问题,最后又下载了一个其他版本的solr ,把web.xml文件单独...

    solr+tomcat项目

    Solr+Tomcat项目整合是将Apache Solr搜索引擎与Apache Tomcat应用服务器结合使用的过程,以便在Web环境中部署和运行Solr服务。Solr是一个基于Lucene的全文搜索服务器,而Tomcat则是一个轻量级Java应用服务器,常用于...

    linux 下solr7+tomcat8+IK中文分词器

    8. **日志监控**:在运行过程中,查看Tomcat和Solr的日志文件(通常在`logs`目录下)以确保没有错误发生,这对问题排查至关重要。 9. **性能优化**:根据实际需求调整Solr的配置参数,如内存分配、线程池大小等,以...

    Flume+Solr演示demo.pdf

    ### Flume+Solr集成过程 #### 准备测试数据 为了演示Flume+Solr集成,首先需要准备测试数据。在Flume+Solr的演示demo中,测试数据是由一个名为GenerateSolrTestData.java的Java程序生成的。该程序能够生成约300000...

    支持solr5.5 solr6.0中IK分词需要的资料

    标题和描述提到的是针对Solr 5.5和Solr 6.0版本的IK分词器支持的相关资料,这意味着这些资源可能包括配置文件、文档、示例代码或者更新日志,帮助用户在这些特定版本的Solr中集成和优化IK分词器。 首先,让我们来看...

Global site tag (gtag.js) - Google Analytics