`
df274119386
  • 浏览: 55638 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

tomcat 集成solr+paoding or Ikanalyer

    博客分类:
  • solr
阅读更多
一.
1.        安装tomcat6.0

2.        下载apache-solr-3.1.0.zip

http://labs.xiaonei.com/apache-mirror/lucene/solr/3.1.0/



3.        解压后,打开apache-solr-3.1.0\dist目录,找到apache-solr-1.3.0.war,改名为solr.war(为了方便而已),然后把其考到tomcat的webapps目录下。

4.        运行tomcat后再webapps下会自动生成solr文件夹。

5.        在tomcat下的\conf\Catalina\localhost中加入solr.xml,内容如下:



<?xml version="1.0" encoding="UTF-8"?>



<Context reloadable="true" docBase="D:/solr/solr.war" > 

   <Environment name="solr/home" type="java.lang.String" value="D:/solr/solr" override="true" /> 

</Context>



其中docBase对应solr.war的路径,可以改动

    Value对应solr的home,可以改动



6.        把apache-solr-1.3.0\example\solr下的文件夹(包括bin,conf,data)考到solr的home目录下。

7.        重启tomcat,进行测试http://localhost:8080/solr/admin/analysis.jsp

二. solr集成paoding分词
1.设置环境变量PAODING_DIC_HOME;“变量值”为词库目录(dic),如 d:/solr/solr/dic

2. 修改paoding-dic-home.properties文件,添加宽paoding.dic.home指向词典目录,运行build.bat, 重新编译生成jar包
paoding.dic.home=D:\solr\dic

3.把paoding-analysis.jar放入到solr.war.lib目录下

4. 修改solr配置文件, solr.home/conf/schema.xml 修改或加 text fieldType 元素,如:
	<fieldType name="text" class="solr.TextField">
		<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer" />

		<analyzer type="index">
			<tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory"
				isMaxWordLength="false" />
			<filter class="solr.StopFilterFactory" ignoreCase="true"
				words="stopwords.txt" />
			<filter class="solr.WordDelimiterFilterFactory"
				generateWordParts="1" generateNumberParts="1" catenateWords="1"
				catenateNumbers="1" catenateAll="0" splitOnCaseChange="1" />
			<filter class="solr.LowerCaseFilterFactory" />
			<filter class="solr.EnglishPorterFilterFactory" protected="protwords.txt" />
			<filter class="solr.RemoveDuplicatesTokenFilterFactory" />
		</analyzer>
		<analyzer type="query">
			<tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory"
				isMaxWordLength="true" />
			<filter class="solr.StopFilterFactory" ignoreCase="true"
				words="stopwords.txt" />
			<filter class="solr.WordDelimiterFilterFactory"
				generateWordParts="1" generateNumberParts="1" catenateWords="1"
				catenateNumbers="1" catenateAll="0" splitOnCaseChange="1" />
			<filter class="solr.LowerCaseFilterFactory" />
			<filter class="solr.EnglishPorterFilterFactory" protected="protwords.txt" />
			<filter class="solr.RemoveDuplicatesTokenFilterFactory" />
		</analyzer>

	</fieldType>   


5.启动 tomcat 打开,http://localhost:8080/solr/admin/analysis.jsp,测试 paoding, 看是否正常工作


三. solr集成Ikanalyzer分词

...

本文转至http://blog.chenlb.com/2009/06/use-paoding-chinese-segment-in-solr.html

分享到:
评论

相关推荐

    tomcat8+solr7.4+IK

    【标题】"Tomcat8+Solr7.4+IK"是一个在Linux环境下搭建的搜索引擎解决方案,其中包含了Apache Tomcat 8作为应用服务器,Solr 7.4作为搜索引擎核心,以及IK Analyzer作为中文分词工具。这个配置适用于需要处理大量...

    solr+paoding

    ### Solr + Paoding:构建高效全文检索系统 #### 一、Solr简介与核心功能 **Solr** 是一种开放源代码的企业级搜索平台,它基于 **Lucene Java**,能够提供强大的全文检索功能。Solr 的核心优势在于其灵活易用的...

    solr+IK分词集成tomcat实现电商项目的全文检索

    压缩包内含有solr+ik如何配置的详细介绍以及solr+ik的包,省去了自己去找地址下载的麻烦,经测试使用完全可以在电商电商项目中实现全文检索

    Solr3.2 + Paoding中文分词的搜索引擎

    Solr3.2 + Paoding中文分词的搜索引擎是一个针对中文文档进行高效检索的解决方案,结合了Apache Solr 3.2版本与Paoding分词器的优势。Apache Solr是基于Lucene的开源搜索服务器,提供了更高级别的API和配置选项,而...

    tomcat8.5+solr7+IKAnalyzer5

    标题"tomcat8.5+solr7+IKAnalyzer5"指出这是一个集成项目,其中包含了三个关键组件:Tomcat 8.5版本,Solr 7版本,以及IKAnalyzer 5版本。Tomcat是Apache软件基金会的一个开源项目,用作Java Servlet和JavaServer ...

    solr+tomcat项目

    Solr+Tomcat项目整合是将Apache Solr搜索引擎与Apache Tomcat应用服务器结合使用的过程,以便在Web环境中部署和运行Solr服务。Solr是一个基于Lucene的全文搜索服务器,而Tomcat则是一个轻量级Java应用服务器,常用于...

    solr+IK分词集成tomcat实现全文检索

    Solr+IK分词集成Tomcat实现全文检索是构建高效搜索引擎的关键步骤,尤其在电子商务等大量数据检索场景中,这一技术的应用尤为重要。本教程将详细阐述如何通过Solr结合IK分词器,在Tomcat服务器上搭建一个功能完备的...

    tomcat8.5+solr7+IKAnalyzer5+ikpinyin直装版

    【标题】"tomcat8.5+solr7+IKAnalyzer5+ikpinyin直装版" 提供了一个集成的搜索引擎环境,其中包含了Tomcat 8.5作为应用服务器,Solr 7作为核心搜索引擎,以及IKAnalyzer5和ikpinyin这两个中文分词插件。这个组合特别...

    Solr+Paodng中文搜索引擎__Demo

    Solr+Paoding中文搜索引擎Demo是一个综合性的项目,旨在展示如何结合Apache Solr与Paoding中文分词器来构建一个高效、精准的中文搜索引擎。Apache Solr是一个流行的开源全文搜索服务器,而Paoding中文分词器是专为...

    solr+tomcat处理后的简易部署+说明文档(下)

    Solr与Tomcat的组合是常见的一种搜索引擎服务部署方式,其中Solr提供了强大的全文搜索功能,而Tomcat作为流行的Java应用服务器,为Solr提供运行环境。本篇将详细讲解如何进行Solr与Tomcat的简易部署,并结合提供的...

    solr+spring+hibernate+maven+webservice整合框架

    Solr+Spring+Hibernate+Maven+WebService整合框架是一个常见的企业级应用开发模式,它将搜索引擎Solr、持久层框架Hibernate、服务层框架Spring、构建工具Maven以及Web服务接口结合在一起,提供了一种高效、灵活的...

    window下tomcat+solr整合

    标题中的“window下tomcat+solr整合”指的是在Windows操作系统环境下,将Apache Tomcat(一个流行的Java Servlet容器)与Apache Solr(一个基于Lucene的全文搜索服务器)进行集成,以便实现高效的全文检索功能。...

    solr+IKAnalyzer部署

    NULL 博文链接:https://lpyyn.iteye.com/blog/2074539

    中文搜索分词lucene包+paoding包

    - **扩展性**:随着数据量的增长,可能需要考虑分布式索引和搜索,这可以通过Lucene的分布式解决方案如Solr或Elasticsearch来实现。 - **错误处理和日志记录**:在处理大量数据时,应确保有良好的错误处理机制,...

    tomcat+solr3.6+mmseg4j

    【标题】"Tomcat+Solr3.6+MMSEG4J"整合及应用实例 在Web开发领域,搜索引擎和全文检索功能变得越来越重要。Apache Solr作为一个强大的、开源的企业级搜索平台,常被用于构建高效、可扩展的搜索解决方案。而Tomcat...

    solr 5.0.0 + tomcat7 安装 + IKAnalyzer中文分词

    通过以上步骤,你就成功地在Tomcat7上安装并配置了Solr 5.0.0,同时集成了IKAnalyzer实现中文分词。这使得你可以处理中文文本,提高搜索准确性和用户体验。记得定期更新Solr和IKAnalyzer,以获取最新的性能优化和...

Global site tag (gtag.js) - Google Analytics