`
lu_tan
  • 浏览: 28191 次
  • 来自: 上海
社区版块
存档分类
最新评论

solr4.9+mmseg4j

    博客分类:
  • solr
阅读更多

1.solr4.9

   mmseg4j-solr-2.2.0

   tomcat6

   jdk1.7

2.步骤:

   前提:已经下载好TOMCAT、SOLR及MMSEG4J

   2.1 TOMCAT_HOME下创建文件夹solr_home,将solr_home\example\solr的bin及collection1复制到     solr_home,将solr-4.9.0.war复制到TOMCAT_HOME\webapps,且把solr-4.9.0.war改成solr.war;

   2.2 启动TOMCAT,这时会失败,不处理;

   2.3 TOMCAT_HOME\webapps\solr\WEB-INFO,web.xml中的

    <!--

         <env-entry>

           <env-entry-name>solr/home</env-entry-name>

           <env-entry-value>/put/your/solr/home/here</env-entry-value>

           <env-entry-type>java.lang.String</env-entry-type>

          </env-entry>

          -->改成

         <env-entry>

               <env-entry-name>solr/home</env-entry-name>

               <env-entry-value>../solr_home</env-entry-value>

               <env-entry-type>java.lang.String</env-entry-type>

         </env-entry>

    2.4  将solr_home\example\lib\ext下面的jar及mmseg4j-solr-2.2.0-with-mmseg4j-core中的jar包复制到                  TOMCAT_HOME\webapps\solr\WEB-INFO\lib; 

   2.5  修改solr_home\conf\schema.xml,将

          <fieldtype name="textComplex" class="solr.TextField" positionIncrementGap="100">

               <analyzer>

               <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex"                                     dicPath="dic"/>

               </analyzer>

         </fieldtype>

         <fieldtype name="textMaxWord" class="solr.TextField" positionIncrementGap="100">

               <analyzer>

                      <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word" />

               </analyzer>

        </fieldtype>

        <fieldtype name="textSimple" class="solr.TextField" positionIncrementGap="100">

              <analyzer>

                      <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple"                                       dicPath="n:/custom/path/to/my_dic" />

              </analyzer>

        </fieldtype>复制到此文件;

3.启动TOMCAT即可。

注:可到此地址(https://github.com/chenlb/mmseg4j-solr)下载mmseg4j-solr-2.2.0-with-mmseg4j-core,也可在附件中直接下载,此版本支持solr4.9

分享到:
评论
1 楼 langxuanlovehai 2014-10-10  
很好,很强大,正是我需要的,谢谢

相关推荐

    Solr3.2 + mmseg4j-1.8.4中文搜索引擎_Demo

    Solr3.2 + mmseg4j-1.8.4中文搜索引擎Demo是一个演示项目,旨在展示如何在Solr3.2版本中结合mmseg4j实现高效的中文搜索功能。Solr是Apache软件基金会开发的一个开源全文搜索引擎,它提供了一个分布式、可扩展且高度...

    solr4.9+tomcat+zookeeper集群

    四、Solr 4.9集群搭建步骤 1. **安装Zookeeper**: 设置Zookeeper集群,确保集群稳定运行。 2. **部署Tomcat**: 在每个节点上安装Tomcat,并配置相应的环境变量。 3. **部署Solr**: 将Solr 4.9的war文件部署到每个...

    tomcat+solr3.6+mmseg4j

    【标题】"Tomcat+Solr3.6+MMSEG4J"整合及应用实例 在Web开发领域,搜索引擎和全文检索功能变得越来越重要。Apache Solr作为一个强大的、开源的企业级搜索平台,常被用于构建高效、可扩展的搜索解决方案。而Tomcat...

    solr4.7.2+mmseg2.0+pinyinAnalyzer实现拼音、简拼检索

    4. **索引构建**:使用Solr的索引工具,如DataImportHandler,将中文数据导入Solr,此时mmseg2.0会进行分词,而pinyinAnalyzer则处理拼音。 5. **测试和优化**:索引构建完成后,通过Solr的管理界面或API进行搜索...

    solr4.9开发所需jar包

    Solr4.9是Apache Solr的一个版本,它是一个基于Lucene的全文搜索服务器,用于构建高效的、可扩展的搜索应用。在这个版本中,Solr提供了丰富的查询功能、高效的索引和搜索性能,以及灵活的数据处理能力。"solr4.9开发...

    兼容solr4.10.3的mmseg4j-1.9.1分词器

    "兼容solr4.10.3的mmseg4j-1.9.1分词器" 这个标题表明我们正在讨论的是一个针对Solr 4.10.3版本优化的mmseg4j分词器,版本号为1.9.1。mmseg4j是一款广泛使用的Java实现的中文分词库,它提供了高效且精准的中文分词...

    solr6配置mmseg4j

    在Solr6中配置mmseg4j是为了实现中文分词,从而提升搜索效果。mmseg4j是基于Java的一个高性能中文分词库,它提供了多种分词算法,如最长匹配、最短路径等,以满足不同的分词需求。 首先,我们需要理解Solr6的基本...

    solr4.9与tomcat8,tomcat7整合

    - 将`solr-4.9.0/example/resources/log4j.properties`复制到`tomcat/webapps/solr/WEB-INF/classes`,确保日志模块正常工作。 - 修改`solr/home/solr.xml`文件,删除原有内容并添加如下配置: ```xml &lt;solr&gt; ...

    mmseg4j-solr-2.4.0.jar

    而mmseg4j-solr-2.4.0.jar是mmseg4j分词库的Solr插件版本,专为Solr设计,使得开发者可以方便地将mmseg4j的分词功能集成到Solr中,以提升搜索性能和精确度。 在Solr 6.3版本下,要使用mmseg4j-solr-2.4.0.jar,首先...

    solr6配置mmseg4j所需dic文件和jar包

    solr6配置mmseg4j所需dic文件和jar包,包括word.dic,mmseg4j-core-1.10.0.jar,mmseg4j-solr-2.3.0.jar

    mmseg4j-solr-mmseg4j-solr-2.2.0.zip

    《mmseg4j-solr在搜索引擎优化中的应用与实现》 在当今信息化时代,搜索引擎已经成为获取信息的主要渠道。为了提升用户体验,搜索引擎需要提供精确、快速的搜索结果。在这个过程中,中文分词技术起着至关重要的作用...

    在tomcat环境下搭建solr3.5和mmseg4j搜索引擎

    ### 在Tomcat环境下搭建Solr 3.5与MMSEG4J搜索引擎 #### 一、配置Solr环境 1. **下载Solr** - 访问官方下载页面:[http://www.apache.org/dyn/closer.cgi/lucene/solr/]...

    mmseg4j-solr-2.2.0-with-mmseg4j-core.zip

    mmseg4j-solr-2.2.0-with-mmseg4j-core.zip是一个专门为Solr 4.9版本设计的中文分词解决方案,旨在提升中文搜索的准确性和效率。 mmseg4j是基于Java实现的中文分词库,全称为“Minimum Edit Distance Segmentation ...

    ik+mmseg分词器

    5. 如果需要启用 MMSEG 功能,还需要在 IK 分词器的配置中指定 `mmseg4j` 插件,并配置相应的参数。 6. 重启 Solr 服务,使配置生效。 通过以上配置,你就可以在 Solr 6.1 中使用 IK+MMSEG 分词器了。这个组合不仅...

    solr mmseg4j 中文分词器

    mmseg4j-solr-2.3.0.jar 支持 solr5.x 版本以上 分词器本身并未做升级还是mmseg4j-core-1.10.0 和 mmseg4j-analysis-1.9.1.jar为了方便也一并上传

    mmseg4j-solr-2.1.0-with-mmseg4j-core.zip

    《mmseg4j-solr-2.1.0-with-mmseg4j-core.zip:Solr4.8与mmseg4j分词器的集成详解》 在信息检索和文本挖掘领域,搜索引擎扮演着至关重要的角色,而Apache Solr作为一款高效、可扩展的开源全文搜索平台,被广泛应用...

    solr6配置mmseg4j所需jar包和dic文件

    在Solr6版本中,为了实现中文分词,我们通常会引入第三方分词器,如mmseg4j。mmseg4j是一个基于Java的高效中文分词库,它可以提供灵活的分词规则,适用于各种应用场景。 配置mmseg4j涉及到的主要步骤包括: 1. **...

    solr 分词器 mmseg4j IKAnalyzer

    在 Solr 中,mmseg4j-solr-*.jar 文件用于集成 mmseg4j 到 Solr 环境,提供对中文文本的分词支持。 2. **IKAnalyzer** 是一个基于 Lucene 的开源中文分词器,它的全称是 "Intelligent Chinese Analyzer"。IK...

    mmseg4j-solr总共4个文件

    里面包含了mmseg4j-solr-2.0.0.jar,mmseg4j-solr-2.1.0.jar,mmseg4j-solr-2.2.0.jar,mmseg4j-solr-2.3.0.jar总共4个文件,其中: mmseg4j-solr-2.0.0.jar 要求 lucene/solr &gt;= 4.3.0。在 lucene/solr [4.3.0, 4.7.1]...

Global site tag (gtag.js) - Google Analytics