solr1.3 multicore + tomcat5.5 + paoding分词安装 -

JLK

浏览: 236718 次
性别:
来自: 上海

最近访客更多访客>>

janjan007

thankus

ruanjiamin816

haroldhan1977

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

solr1.3 multicore + tomcat5.5 + paoding分词安装

博客分类：

solr

Solr .net Tomcat Apache lucene

一.安装jdk6,tomcat5.5。
二.解压solr1.3，创建以下目录：
/usr/local/solr/solrApps: 保存的是solr.war
/usr/local/solr/multicore : 保存的是多核 solr的配制文件
拷贝solr1.3解压目录里的dist/apache-solr-1.3.0.war到solrApps里，example/multicore里的文件到multicore里。
三.配制如下：
1.在tomcat/conf/Catalina/localhost目录里增加solr.xml内容如下：

<?xml version="1.0" encoding="UTF-8" ?>  
  
<Context docBase="/usr/local/solr/solrApps/solr.war" debug="0" crossContext="true" >  
<Environment name="solr/home" type="java.lang.String" value="/usr/local/solr/multicore" override="true" />  
</Context>

2.修改solr/multicore/solr.xml配制solr的多核参数为：

<solr persistent="false" sharedLib="paodingLib"> //增加一个共享lib配制,存放中文分词paoding的文件。

 <!--adminPath: RequestHandler path to manage cores.    
 If 'null' (or absent), cores will not be manageable via REST  
  -->  
 <cores adminPath="/admin/cores">  
 <core name="core0" instanceDir="core0" />  
<core name="core1" instanceDir="core1" />  
 </cores>  
</solr>

3.配制multicore/core0/conf/solrconfig.xml，内容如下：

 <updateHandler class="solr.DirectUpdateHandler2" />  
    
 <dataDir>/usr/local/solr/multicore/sodao</dataDir>  //此处配制每个core创建个自索引文件的目录，在配制目录下自动创建一个index目录，保存索引文件  
  
 <requestDispatcher handleSelect="true" >  
<requestParsers enableRemoteStreaming="false" multipartUploadLimitInKB="2048" />  
 </requestDispatcher>  
    
 <requestHandler name="standard" class="solr.StandardRequestHandler" default="true" />  
 <requestHandler name="/update" class="solr.XmlUpdateRequestHandler" />  
 <requestHandler name="/admin/" <pre name="code" class="java"></pre>class="org.apache.solr.handler.admin.AdminHandlers" />  
      
<!-- config for the admin interface -->   
<admin>  
 <defaultQuery>solr</defaultQuery>  
</admin>  
 
</config>

这个目录里的schema.xml为创建索引文件的配制。

四、起动tomcat，输入http://localhost:8080/solr，测试

五、配制中文paoding分词
1.在网上下载paoding分词，将分词的lib包放到/usr/local/solr/multicore放到这个目录下面，并编写如下类：

	package net.qhsoft.analyzer;  
	  
	import java.io.Reader;  
	import java.util.Map;  
	  
	import net.paoding.analysis.analyzer.PaodingTokenizer;  
	import net.paoding.analysis.analyzer.TokenCollector;  
	import net.paoding.analysis.knife.PaodingMaker;  
	import net.paoding.analysis.analyzer.impl.MostWordsTokenCollector;  
	import net.paoding.analysis.analyzer.impl.MaxWordLengthTokenCollector;  
	import org.apache.lucene.analysis.TokenStream;  
	import org.apache.solr.analysis.BaseTokenizerFactory;  
	  
	public class ChineseTokenizerFactory extends BaseTokenizerFactory {  
	  
	    /** 
	 
	     * 最多切分   默认模式 
	 
	     */  
	  
	    public static final String MOST_WORDS_MODE = "most-words";  
	  
	    /** 
	 
	     * 按最大切分 
	 
	     */  
	  
	    public static final String MAX_WORD_LENGTH_MODE = "max-word-length";  
	  
	    private String mode = null;  
	  
	    public void setMode(String mode) {  
	  
	             if (mode==null||MOST_WORDS_MODE.equalsIgnoreCase(mode)  
	  
	                      || "default".equalsIgnoreCase(mode)) {  
	  
	                  this.mode=MOST_WORDS_MODE;  
	  
	             } else if (MAX_WORD_LENGTH_MODE.equalsIgnoreCase(mode)) {  
	  
	                  this.mode=MAX_WORD_LENGTH_MODE;  
	  
	             }  
	  
	             else {  
	  
	                  throw new IllegalArgumentException("不合法的分析器Mode参数设置:" + mode);  
	  
	             }  
	  
	        }  
	  
	    @Override  
	  
	    public void init(Map<String, String> args) {  
	  
	        super.init(args);  
	  
	        setMode(args.get("mode"));  
	  
	    }  
	  
	    public TokenStream create(Reader input) {  
	  
	        return new PaodingTokenizer(input, PaodingMaker.make(),  
	  
	                  createTokenCollector());  
	  
	    }  
	  
	    private TokenCollector createTokenCollector() {  
	  
	        if( MOST_WORDS_MODE.equals(mode))  
	  
	             return new MostWordsTokenCollector();  
	  
	        if( MAX_WORD_LENGTH_MODE.equals(mode))  
	  
	             return new MaxWordLengthTokenCollector();  
	  
	        throw new Error("never happened");  
	  
	    }  
	  
	}

打成一个net.jar包，也放到lib包里面
2. 把paoding的字典放到/usr/local/solr/multicore下面的dic目录里，并编辑/etc/profile文件，增加：
export PAODING_DIC_HOME=/usr/local/solr/multicore/dic
3.将lib目录下的paoding-analysis.properties，paoding-dic-home.properties两个文件考到/usr/local/solr目录下面。

分享到：

solr一些概念 | solr的distribution搜索

2010-12-27 09:49
浏览 1578
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

MATLAB实现多种群遗传算法(完整代码): 1.程序功能说明： MATLAB实现多种群遗传算法(完整代码) 逼近C=[9,8,7,6,5,4,3,2,1]的9维向量. 2.代码说明：注释清晰，参数和变量说明清晰，方便更改、方便初学者使用，模块化编程，方便替换目标函数。运行环境Windows7及以上操作系统，MATLAB2014a及以上版本。 3.适用专业：计算机、电子信息工程、数学、物理、机械工程、土木工程等专业的大学生、研究生毕业设计，各类专业的课程设计、海外留学生作业等。 4作者介绍：资深算法工程师, 从事Matlab、Python算法仿真工作15年，专业研究遗传算法、粒子群算法、蚁群算法、鲸鱼算法、狼群算法等. 有问题联系QQ: 1579325979

小区物业管理系统免费JAVA毕业设计 2024成品源码+论文+数据库+启动教程.zip: 免费JAVA毕业设计 2024成品源码+论文+数据库+启动教程启动教程：https://www.bilibili.com/video/BV1SzbFe7EGZ 项目讲解视频：https://www.bilibili.com/video/BV1Tb421n72S 二次开发教程：https://www.bilibili.com/video/BV18i421i7Dx

前后端分离爱家商城免费JAVA毕业设计 2024成品源码+论文+录屏+启动教程.zip: 免费JAVA毕业设计 2024成品源码+论文+录屏+启动教程启动教程：https://www.bilibili.com/video/BV1SzbFe7EGZ 项目讲解视频：https://www.bilibili.com/video/BV1Tb421n72S 二次开发教程：https://www.bilibili.com/video/BV18i421i7Dx

小学元旦晚会PPT 模版: 小学元旦晚会PPT 模版

日常办公用品直售推荐系统免费JAVA毕业设计 2024成品源码+论文+数据库+启动教程.zip: 免费JAVA毕业设计 2024成品源码+论文+数据库+启动教程启动教程：https://www.bilibili.com/video/BV1SzbFe7EGZ 项目讲解视频：https://www.bilibili.com/video/BV1Tb421n72S 二次开发教程：https://www.bilibili.com/video/BV18i421i7Dx

MATLAB中的语义分割技术探究与应用实践,matlab，语义分割 ,matlab; 语义分割,Matlab语义分割技术解析: MATLAB中的语义分割技术探究与应用实践,matlab，语义分割 ,matlab; 语义分割,Matlab语义分割技术解析

网上家具商城免费JAVA毕业设计 2024成品源码+论文+录屏+启动教程.zip: 免费JAVA毕业设计 2024成品源码+论文+数据库+启动教程启动教程：https://www.bilibili.com/video/BV1SzbFe7EGZ 项目讲解视频：https://www.bilibili.com/video/BV1Tb421n72S 二次开发教程：https://www.bilibili.com/video/BV18i421i7Dx

pulseaudio-10.0-6.el7-9.x64-86.rpm.tar.gz: 1、文件内容：pulseaudio-10.0-6.el7_9.rpm以及相关依赖 2、文件形式：tar.gz压缩包 3、安装指令： #Step1、解压 tar -zxvf /mnt/data/output/pulseaudio-10.0-6.el7_9.tar.gz #Step2、进入解压后的目录，执行安装 sudo rpm -ivh *.rpm 4、安装指导：私信博主，全程指导安装

"基于OpenCV与深度学习的人脸表情识别系统：利用Python与PyQt构建的可视化实时检测工具",基于OpenCV的人脸表情识别系统相关技术：python，opencv，pyqt，深度学习（请: "基于OpenCV与深度学习的人脸表情识别系统：利用Python与PyQt构建的可视化实时检测工具",基于OpenCV的人脸表情识别系统相关技术：python，opencv，pyqt，深度学习（请自行安装向日葵远程软件，以便提供远程帮助）可编译为.exe文件。软件说明：摄像头实时检测，加载照片，视频均可。有基础的同学，可自行修改完善。第一张和第二张为运行截图。 ,基于OpenCV的人脸表情识别系统; Python; OpenCV; PyQt; 深度学习; 实时检测; 照片和视频支持; 可编译为.exe文件; 运行截图。,"基于OpenCV与深度学习的人脸表情识别系统"

,步进方案，步进源码，两相步进矢量控制，超前角控制两种模式，成熟产品方案支持特殊功能定制: ,步进方案，步进源码，两相步进矢量控制，超前角控制两种模式，成熟产品方案支持特殊功能定制

三相储能PCS双向能量流动与Matlab仿真控制研究-基于SVPWM调制技术的建模与应用,三相储能PCS（Matlab仿真） 1.可实现Grid to Battery，Battery to Grid: 三相储能PCS双向能量流动与Matlab仿真控制研究——基于SVPWM调制技术的建模与应用,三相储能PCS（Matlab仿真） 1.可实现Grid to Battery，Battery to Grid的能量双向流动。 2.本仿真基于Matlab仿真建立的模型， 3.采用SVPWM进行控制 ,三相储能PCS; 双向能量流动; Matlab仿真; SVPWM控制,三相储能PCS：能量双向流Matlab仿真模型（SVPWM控制）

deepseek部署教程.md: deepseek部署教程.md

nodejs010-nodejs-ansicolors-0.3.2-1.el6.centos.alt.noarch.rpm: nodejs010-nodejs-ansicolors-0.3.2-1.el6.centos.alt.noarch.rpm

基于三菱PLC的四路抢答器控制系统原理及实践：含带解释的梯形图与IO分配图解,三菱 MCGS 基于PLC的四路抢答器控制系统带解释的梯形图接线图原理图图纸，io分配，组态画面 ,三菱M: 基于三菱PLC的四路抢答器控制系统原理及实践：含带解释的梯形图与IO分配图解,三菱 MCGS 基于PLC的四路抢答器控制系统带解释的梯形图接线图原理图图纸，io分配，组态画面 ,三菱MCGS; PLC四路抢答器; 控制系统; 梯形图接线图; 原理图图纸; IO分配; 组态画面。,三菱PLC四路抢答器控制系统原理图及组态画面解析

基于运动数据时空特征提取的人类运动片段.pdf: 基于运动数据时空特征提取的人类运动片段.pdf

基于机器学习的选股模型及投资组合研究.pdf: 基于机器学习的选股模型及投资组合研究.pdf

Ollama免费下载安装包: ollama安装包。。。。。。。。。。。。。。。。。

nodejs010-nodejs-ansistyles-0.1.3-1.el6.centos.alt.x86_64.rpm: nodejs010-nodejs-ansistyles-0.1.3-1.el6.centos.alt.x86_64.rpm

Screenshot_20250201_111207_com_tencent_mm_LauncherUI.jpg: Screenshot_20250201_111207_com_tencent_mm_LauncherUI.jpg

基于时空Transformer的端到端的视频注视目标检测.pdf: 基于时空Transformer的端到端的视频注视目标检测.pdf

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

solr1.3 multicore + tomcat5.5 + paoding分词安装

评论

发表评论

相关推荐

solr定制文档hash

Distributed Requests

collection async

Collections API timeouts

Solr原子更新

solr分组聚合

solr 空格关键词

索引排序

IK自定义词库

解决Tomcat Too Many Open Files问题

solr 查询参数说明

solrJ查询使用方法

solr的复制功能

solr更换memcached缓存的方法

Solr调优

solr的一些查询语法

Solr的检索运算符

查找相似页面

solr 1.3 更多扩展点

solr一些概念

最近访客更多访客>>