一.
1. 安装tomcat6.0
2. 下载apache-solr-3.1.0.zip
http://labs.xiaonei.com/apache-mirror/lucene/solr/3.1.0/
3. 解压后,打开apache-solr-3.1.0\dist目录,找到apache-solr-1.3.0.war,改名为solr.war(为了方便而已),然后把其考到tomcat的webapps目录下。
4. 运行tomcat后再webapps下会自动生成solr文件夹。
5. 在tomcat下的\conf\Catalina\localhost中加入solr.xml,内容如下:
<?xml version="1.0" encoding="UTF-8"?>
<Context reloadable="true" docBase="D:/solr/solr.war" >
<Environment name="solr/home" type="java.lang.String" value="D:/solr/solr" override="true" />
</Context>
其中docBase对应solr.war的路径,可以改动
Value对应solr的home,可以改动
6. 把apache-solr-1.3.0\example\solr下的文件夹(包括bin,conf,data)考到solr的home目录下。
7. 重启tomcat,进行测试http://localhost:8080/solr/admin/analysis.jsp
二. solr集成paoding分词
1.设置环境变量PAODING_DIC_HOME;“变量值”为词库目录(dic),如 d:/solr/solr/dic
2. 修改paoding-dic-home.properties文件,添加宽paoding.dic.home指向词典目录,运行build.bat, 重新编译生成jar包
paoding.dic.home=D:\solr\dic
3.把paoding-analysis.jar放入到solr.war.lib目录下
4. 修改solr配置文件, solr.home/conf/schema.xml 修改或加 text fieldType 元素,如:
<fieldType name="text" class="solr.TextField">
<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer" />
<analyzer type="index">
<tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory"
isMaxWordLength="false" />
<filter class="solr.StopFilterFactory" ignoreCase="true"
words="stopwords.txt" />
<filter class="solr.WordDelimiterFilterFactory"
generateWordParts="1" generateNumberParts="1" catenateWords="1"
catenateNumbers="1" catenateAll="0" splitOnCaseChange="1" />
<filter class="solr.LowerCaseFilterFactory" />
<filter class="solr.EnglishPorterFilterFactory" protected="protwords.txt" />
<filter class="solr.RemoveDuplicatesTokenFilterFactory" />
</analyzer>
<analyzer type="query">
<tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory"
isMaxWordLength="true" />
<filter class="solr.StopFilterFactory" ignoreCase="true"
words="stopwords.txt" />
<filter class="solr.WordDelimiterFilterFactory"
generateWordParts="1" generateNumberParts="1" catenateWords="1"
catenateNumbers="1" catenateAll="0" splitOnCaseChange="1" />
<filter class="solr.LowerCaseFilterFactory" />
<filter class="solr.EnglishPorterFilterFactory" protected="protwords.txt" />
<filter class="solr.RemoveDuplicatesTokenFilterFactory" />
</analyzer>
</fieldType>
5.启动 tomcat 打开,http://localhost:8080/solr/admin/analysis.jsp,测试 paoding, 看是否正常工作
三. solr集成Ikanalyzer分词
...
本文转至
http://blog.chenlb.com/2009/06/use-paoding-chinese-segment-in-solr.html
分享到:
相关推荐
【标题】"Tomcat8+Solr7.4+IK"是一个在Linux环境下搭建的搜索引擎解决方案,其中包含了Apache Tomcat 8作为应用服务器,Solr 7.4作为搜索引擎核心,以及IK Analyzer作为中文分词工具。这个配置适用于需要处理大量...
### Solr + Paoding:构建高效全文检索系统 #### 一、Solr简介与核心功能 **Solr** 是一种开放源代码的企业级搜索平台,它基于 **Lucene Java**,能够提供强大的全文检索功能。Solr 的核心优势在于其灵活易用的...
压缩包内含有solr+ik如何配置的详细介绍以及solr+ik的包,省去了自己去找地址下载的麻烦,经测试使用完全可以在电商电商项目中实现全文检索
Solr3.2 + Paoding中文分词的搜索引擎是一个针对中文文档进行高效检索的解决方案,结合了Apache Solr 3.2版本与Paoding分词器的优势。Apache Solr是基于Lucene的开源搜索服务器,提供了更高级别的API和配置选项,而...
标题"tomcat8.5+solr7+IKAnalyzer5"指出这是一个集成项目,其中包含了三个关键组件:Tomcat 8.5版本,Solr 7版本,以及IKAnalyzer 5版本。Tomcat是Apache软件基金会的一个开源项目,用作Java Servlet和JavaServer ...
Solr+Tomcat项目整合是将Apache Solr搜索引擎与Apache Tomcat应用服务器结合使用的过程,以便在Web环境中部署和运行Solr服务。Solr是一个基于Lucene的全文搜索服务器,而Tomcat则是一个轻量级Java应用服务器,常用于...
Solr+IK分词集成Tomcat实现全文检索是构建高效搜索引擎的关键步骤,尤其在电子商务等大量数据检索场景中,这一技术的应用尤为重要。本教程将详细阐述如何通过Solr结合IK分词器,在Tomcat服务器上搭建一个功能完备的...
【标题】"tomcat8.5+solr7+IKAnalyzer5+ikpinyin直装版" 提供了一个集成的搜索引擎环境,其中包含了Tomcat 8.5作为应用服务器,Solr 7作为核心搜索引擎,以及IKAnalyzer5和ikpinyin这两个中文分词插件。这个组合特别...
Solr+Paoding中文搜索引擎Demo是一个综合性的项目,旨在展示如何结合Apache Solr与Paoding中文分词器来构建一个高效、精准的中文搜索引擎。Apache Solr是一个流行的开源全文搜索服务器,而Paoding中文分词器是专为...
Solr与Tomcat的组合是常见的一种搜索引擎服务部署方式,其中Solr提供了强大的全文搜索功能,而Tomcat作为流行的Java应用服务器,为Solr提供运行环境。本篇将详细讲解如何进行Solr与Tomcat的简易部署,并结合提供的...
Solr+Spring+Hibernate+Maven+WebService整合框架是一个常见的企业级应用开发模式,它将搜索引擎Solr、持久层框架Hibernate、服务层框架Spring、构建工具Maven以及Web服务接口结合在一起,提供了一种高效、灵活的...
标题中的“window下tomcat+solr整合”指的是在Windows操作系统环境下,将Apache Tomcat(一个流行的Java Servlet容器)与Apache Solr(一个基于Lucene的全文搜索服务器)进行集成,以便实现高效的全文检索功能。...
NULL 博文链接:https://lpyyn.iteye.com/blog/2074539
- **扩展性**:随着数据量的增长,可能需要考虑分布式索引和搜索,这可以通过Lucene的分布式解决方案如Solr或Elasticsearch来实现。 - **错误处理和日志记录**:在处理大量数据时,应确保有良好的错误处理机制,...
【标题】"Tomcat+Solr3.6+MMSEG4J"整合及应用实例 在Web开发领域,搜索引擎和全文检索功能变得越来越重要。Apache Solr作为一个强大的、开源的企业级搜索平台,常被用于构建高效、可扩展的搜索解决方案。而Tomcat...
通过以上步骤,你就成功地在Tomcat7上安装并配置了Solr 5.0.0,同时集成了IKAnalyzer实现中文分词。这使得你可以处理中文文本,提高搜索准确性和用户体验。记得定期更新Solr和IKAnalyzer,以获取最新的性能优化和...