1.solr4.9
mmseg4j-solr-2.2.0
tomcat6
jdk1.7
2.步骤:
前提:已经下载好TOMCAT、SOLR及MMSEG4J
2.1 TOMCAT_HOME下创建文件夹solr_home,将solr_home\example\solr的bin及collection1复制到 solr_home,将solr-4.9.0.war复制到TOMCAT_HOME\webapps,且把solr-4.9.0.war改成solr.war;
2.2 启动TOMCAT,这时会失败,不处理;
2.3 TOMCAT_HOME\webapps\solr\WEB-INFO,web.xml中的
<!--
<env-entry>
<env-entry-name>solr/home</env-entry-name>
<env-entry-value>/put/your/solr/home/here</env-entry-value>
<env-entry-type>java.lang.String</env-entry-type>
</env-entry>
-->改成
<env-entry>
<env-entry-name>solr/home</env-entry-name>
<env-entry-value>../solr_home</env-entry-value>
<env-entry-type>java.lang.String</env-entry-type>
</env-entry>
2.4 将solr_home\example\lib\ext下面的jar及mmseg4j-solr-2.2.0-with-mmseg4j-core中的jar包复制到 TOMCAT_HOME\webapps\solr\WEB-INFO\lib;
2.5 修改solr_home\conf\schema.xml,将
<fieldtype name="textComplex" class="solr.TextField" positionIncrementGap="100">
<analyzer>
<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" dicPath="dic"/>
</analyzer>
</fieldtype>
<fieldtype name="textMaxWord" class="solr.TextField" positionIncrementGap="100">
<analyzer>
<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word" />
</analyzer>
</fieldtype>
<fieldtype name="textSimple" class="solr.TextField" positionIncrementGap="100">
<analyzer>
<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple" dicPath="n:/custom/path/to/my_dic" />
</analyzer>
</fieldtype>复制到此文件;
3.启动TOMCAT即可。
注:可到此地址(https://github.com/chenlb/mmseg4j-solr)下载mmseg4j-solr-2.2.0-with-mmseg4j-core,也可在附件中直接下载,此版本支持solr4.9
相关推荐
Solr3.2 + mmseg4j-1.8.4中文搜索引擎Demo是一个演示项目,旨在展示如何在Solr3.2版本中结合mmseg4j实现高效的中文搜索功能。Solr是Apache软件基金会开发的一个开源全文搜索引擎,它提供了一个分布式、可扩展且高度...
四、Solr 4.9集群搭建步骤 1. **安装Zookeeper**: 设置Zookeeper集群,确保集群稳定运行。 2. **部署Tomcat**: 在每个节点上安装Tomcat,并配置相应的环境变量。 3. **部署Solr**: 将Solr 4.9的war文件部署到每个...
【标题】"Tomcat+Solr3.6+MMSEG4J"整合及应用实例 在Web开发领域,搜索引擎和全文检索功能变得越来越重要。Apache Solr作为一个强大的、开源的企业级搜索平台,常被用于构建高效、可扩展的搜索解决方案。而Tomcat...
4. **索引构建**:使用Solr的索引工具,如DataImportHandler,将中文数据导入Solr,此时mmseg2.0会进行分词,而pinyinAnalyzer则处理拼音。 5. **测试和优化**:索引构建完成后,通过Solr的管理界面或API进行搜索...
Solr4.9是Apache Solr的一个版本,它是一个基于Lucene的全文搜索服务器,用于构建高效的、可扩展的搜索应用。在这个版本中,Solr提供了丰富的查询功能、高效的索引和搜索性能,以及灵活的数据处理能力。"solr4.9开发...
"兼容solr4.10.3的mmseg4j-1.9.1分词器" 这个标题表明我们正在讨论的是一个针对Solr 4.10.3版本优化的mmseg4j分词器,版本号为1.9.1。mmseg4j是一款广泛使用的Java实现的中文分词库,它提供了高效且精准的中文分词...
在Solr6中配置mmseg4j是为了实现中文分词,从而提升搜索效果。mmseg4j是基于Java的一个高性能中文分词库,它提供了多种分词算法,如最长匹配、最短路径等,以满足不同的分词需求。 首先,我们需要理解Solr6的基本...
- 将`solr-4.9.0/example/resources/log4j.properties`复制到`tomcat/webapps/solr/WEB-INF/classes`,确保日志模块正常工作。 - 修改`solr/home/solr.xml`文件,删除原有内容并添加如下配置: ```xml <solr> ...
而mmseg4j-solr-2.4.0.jar是mmseg4j分词库的Solr插件版本,专为Solr设计,使得开发者可以方便地将mmseg4j的分词功能集成到Solr中,以提升搜索性能和精确度。 在Solr 6.3版本下,要使用mmseg4j-solr-2.4.0.jar,首先...
solr6配置mmseg4j所需dic文件和jar包,包括word.dic,mmseg4j-core-1.10.0.jar,mmseg4j-solr-2.3.0.jar
《mmseg4j-solr在搜索引擎优化中的应用与实现》 在当今信息化时代,搜索引擎已经成为获取信息的主要渠道。为了提升用户体验,搜索引擎需要提供精确、快速的搜索结果。在这个过程中,中文分词技术起着至关重要的作用...
### 在Tomcat环境下搭建Solr 3.5与MMSEG4J搜索引擎 #### 一、配置Solr环境 1. **下载Solr** - 访问官方下载页面:[http://www.apache.org/dyn/closer.cgi/lucene/solr/]...
mmseg4j-solr-2.2.0-with-mmseg4j-core.zip是一个专门为Solr 4.9版本设计的中文分词解决方案,旨在提升中文搜索的准确性和效率。 mmseg4j是基于Java实现的中文分词库,全称为“Minimum Edit Distance Segmentation ...
5. 如果需要启用 MMSEG 功能,还需要在 IK 分词器的配置中指定 `mmseg4j` 插件,并配置相应的参数。 6. 重启 Solr 服务,使配置生效。 通过以上配置,你就可以在 Solr 6.1 中使用 IK+MMSEG 分词器了。这个组合不仅...
mmseg4j-solr-2.3.0.jar 支持 solr5.x 版本以上 分词器本身并未做升级还是mmseg4j-core-1.10.0 和 mmseg4j-analysis-1.9.1.jar为了方便也一并上传
《mmseg4j-solr-2.1.0-with-mmseg4j-core.zip:Solr4.8与mmseg4j分词器的集成详解》 在信息检索和文本挖掘领域,搜索引擎扮演着至关重要的角色,而Apache Solr作为一款高效、可扩展的开源全文搜索平台,被广泛应用...
在Solr6版本中,为了实现中文分词,我们通常会引入第三方分词器,如mmseg4j。mmseg4j是一个基于Java的高效中文分词库,它可以提供灵活的分词规则,适用于各种应用场景。 配置mmseg4j涉及到的主要步骤包括: 1. **...
在 Solr 中,mmseg4j-solr-*.jar 文件用于集成 mmseg4j 到 Solr 环境,提供对中文文本的分词支持。 2. **IKAnalyzer** 是一个基于 Lucene 的开源中文分词器,它的全称是 "Intelligent Chinese Analyzer"。IK...
里面包含了mmseg4j-solr-2.0.0.jar,mmseg4j-solr-2.1.0.jar,mmseg4j-solr-2.2.0.jar,mmseg4j-solr-2.3.0.jar总共4个文件,其中: mmseg4j-solr-2.0.0.jar 要求 lucene/solr >= 4.3.0。在 lucene/solr [4.3.0, 4.7.1]...