前面解决了solr部署在tomcat中报错的问题,可是再解决使用solr索引pdf,word文档的时候,又报错了:
java.lang.ClassNotFoundException: solr.extraction.ExtractingRequestHandler 。
分析原因,应该是该类所在的jar包没有包含进去,后来按照wiki :http://wiki.apache.org/solr/ExtractingRequestHandler中的要求把所有的jar包都放到项目的lib目录下,仍然不行,看来是没法加载到这个jar包。
于是,我直接使用solr自带的jetty服务器来测试,看看是否也有这个问题,结果是没有任何问题。于是查看配置文件:solrconfig.xml,发现其中有关于lib目录的定义:
<lib dir="../../contrib/extraction/lib" />
<!-- When a regex is specified in addition to a directory, only the
files in that directory which completely match the regex
(anchored on both ends) will be included.
-->
<lib dir="../../dist/" regex="apache-solr-cell-\d.*\.jar" />
<lib dir="../../dist/" regex="apache-solr-clustering-\d.*\.jar" />
<lib dir="../../dist/" regex="apache-solr-dataimporthandler-\d.*\.jar" />
<!-- If a dir option (with or without a regex) is used and nothing
is found that matches, it will be ignored
-->
<lib dir="../../contrib/clustering/lib/" />
仔细分析这段xml代码,会发现在jetty中测试时,是可以找到那些对应的jar包,但是我是直接复制的conf和data目录到tomcat中solr目录下的,没做任何修改,于是就会出现找不到jar。想到这里,于是就把contrib和dist目录拷贝到tomcat中的solr目录下,然后修改其配置文件solrconfig.xml为:
<lib dir="contrib/extraction/lib" />
<!-- When a regex is specified in addition to a directory, only the
files in that directory which completely match the regex
(anchored on both ends) will be included.
-->
<lib dir="dist/" regex="apache-solr-cell-\d.*\.jar" />
<lib dir="dist/" regex="apache-solr-clustering-\d.*\.jar" />
<lib dir="dist/" regex="apache-solr-dataimporthandler-\d.*\.jar" />
<!-- If a dir option (with or without a regex) is used and nothing
is found that matches, it will be ignored
-->
<lib dir="contrib/clustering/lib/" />
注意,这些目录的起始位置是solr.solr.home。
在这样修改以后,再次运行测试程序,一切ok。
备注:测试的代码来自于:http://wiki.apache.org/solr/ExtractingRequestHandler
测试的文档为solr中docs目录下的tutorial.html文件
最后在地址栏中输入:http://localhost:8080/solr/select?q=attr_content:tutorial 即可看到结果
分享到:
相关推荐
中文分词器ik-analyzer-solr5-5.x.jar,已经打包好,直接用就可以 2积分不黑心
Solr 数据导入调度器(solr-dataimport-scheduler.jar)是一个专门为Apache Solr 7.x版本设计的组件,用于实现数据的定期索引更新。在理解这个知识点之前,我们需要先了解Solr的基本概念以及数据导入处理...
这个压缩包特别为Solr7版本进行了优化,提供了完整的配置文件,使得用户可以方便地集成到Solr中,并自定义分词规则。 首先,让我们来深入了解一下Solr。Apache Solr是一款开源的企业级搜索平台,它基于Lucene库,...
《跟益达学Solr5之玩转post.jar》这篇博文主要探讨了如何利用Solr的`post.jar`工具进行数据导入,这是Solr提供的一个非常实用的功能,用于快速将各种格式的数据导入到Solr索引中。在这个过程中,我们不仅会了解`post...
标题中的 "修改过后的兼容solr6 solr7的dataimportscheduler.jar包" 暗示这个 jar 文件是经过定制优化的,可以同时支持 Solr 6 和 Solr 7 版本。在 Solr 的不同版本间,API 和功能可能会有所变化,因此,这个修改后...
solr.warsolr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包...
下面将详细介绍Solr中的中文分词器及其相关知识。 一、Solr中文分词器概述 在处理中文文档时,由于中文句子没有明显的分隔符,如英文的空格,因此需要使用分词器进行预处理。Solr支持多种中文分词器,如IK Analyzer...
这里我们将围绕"solr-9.0.0-src.tgz"这个源码包,详细探讨其主要组成部分、核心功能以及开发过程中的关键知识点。 1. **Solr架构** Solr的架构基于Lucene,一个强大的全文搜索引擎库。它提供了分布式、可扩展、高...
把solr.war(solr-4.2.0\example\solr-webapp\solr.war)里的东西全复制到WebRoot下 2. 创建solr/home, 把solr-4.2.0\example\solr所有文件复制到你创建的solr/home目录下 3. 创建JNDI让程序找到solr/home(当然你也...
使用solr做数据库定时同步更新数据和索引时用到该jar,经过本人测试通过,放心使用. 支持solr5.x,solr6.x
在实际应用中,Solr可以部署在分布式环境中,通过SolrCloud实现集群管理,实现数据的自动复制和负载均衡,保证服务的高可用性和容错性。Solr的配置文件通常包括solrconfig.xml(定义Solr的行为和处理流程)、schema....
本分卷由2345好压(Haozip)生成,请使用2345好压来解压。 ...分卷文件共有以下3个: 《Solr权威指南 下卷》.haozip01.zip 《Solr权威指南 下卷》.haozip02.zip 《Solr权威指南 下卷》.haozip03.zip
在本套课程中,我们将全面的讲解Solr,从Solr基础到Solr高级,再到项目实战,基本上涵盖了Solr中所有的知识点。 主讲内容 章节一:Solr基础(上) 1. 环境搭建 2. 核心讲解 3. 数据导入 4. 各种中文分析器 章节二:...
经过测试可以适用solr7.4版本。如果低版本solr(6.*) 可以直接适用网上的solr-dataimport-scheduler 1.1 或者1.0版本。
Solr的配置主要在`server/solr/solr.xml`和每个核心的`conf`目录下进行。`solr.xml`定义了Solr的整体配置,如端口设置、数据存储位置等。每个核心有自己的配置,如字段类型、字段配置、搜索处理链等,这些都在`conf`...