windows下solr整合IKAnalyzer中文分词 - - ITeye博客

`

stranger2008

浏览: 119927 次
性别:
来自: 厦门

最近访客更多访客>>

javalinjx

wuguoyong

I958903472

dushougudu

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

wang_yilong： 1024
java tomcat Keytool的使用总结
kenshinyelin： kenshinyelin 写道对啊，控制台看不到原来放错地方了 ...
quartz在tomcat下配置使用
kenshinyelin：对啊，控制台看不到
quartz在tomcat下配置使用
eric_dc：不行啊。不报错，控制台看不到打印结果
quartz在tomcat下配置使用

windows下solr整合IKAnalyzer中文分词

博客分类：

solr

阅读更多

1，文件位置说明

solr服务器目录位于D:\solr_tomcat；

tomcat目录位于D:\tomcat-6.0.18；

solr项目位于D:\tomcat-6.0.18\webapps\solr；

2，IKAnalyzer中文分词包下载，地址为 http://code.google.com/p/ik-analyzer/downloads/list，下载IKAnalyzer3.2.5Stable_bin.zip这个版本。

3，解压IKAnalyzer3.2.5Stable_bin.zip，把ext_stopword.dic、IKAnalyzer.cfg.xml文件拷贝到D:\tomcat-6.0.18\webapps\solr\WEB-INF\classes下，把IKAnalyzer3.2.5Stable.jar拷贝到D:\tomcat-6.0.18\webapps\solr\WEB-INF\lib下。

4，打开D:\solr_tomcat\conf\schema.xml，添加以下代码：

<fieldType name="text_ik" class="solr.TextField">
        <analyzer type="index">
            <tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory"  isMaxWordLength="false"/>
                <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" />
                <filter class="solr.LowerCaseFilterFactory"/>
        </analyzer>
        <analyzer type="query">
            <tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory" isMaxWordLength="true"/>
                <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" />
                <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
                <filter class="solr.LowerCaseFilterFactory"/>
        </analyzer>   
    </fieldType>

5，重启tomcat，打开http://localhost/solr/admin/analysis.jsp，Field下拉框选择Type，右侧输入框输入text_ik，下面输入框输入中文句子，即可查看分词效果。

查看图片附件

分享到：

solr对数据库进行索引 | windows下solr安装

2013-02-22 17:25
浏览 4120
评论(0)
分类:企业架构
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

ikanalyzer中文分词支持lucene7.1.0: ikanalyzer中文分词支持lucene7.1.0是一个针对Lucene搜索引擎的中文分词扩展，由林良益先生开发，旨在提供高效、精准的中文词汇拆解功能。Lucene是一个开源全文检索库，它提供了索引和搜索文本的强大工具。然而，...

solr中文分词jar包ik-analyzer 含class配置 ik-analyzer-7.5.0: 4. **与Solr的整合**：Ik Analyzer为Solr提供了专门的配置，可以无缝对接，实现对Solr索引的中文分词处理。在实际应用中，Ik Analyzer的集成步骤大致如下： 1. **下载与解压**：获取ik-analyzer-7.5.0.jar文件，...

solr+IKAnalyzer部署: Solr+IKAnalyzer部署详解在信息技术领域，搜索引擎的构建是至关重要的，它能帮助我们快速、有效地查找信息。Apache Solr作为一个强大...总的来说，Solr+IKAnalyzer的组合为中文搜索提供了一套高效、灵活的解决方案。

Solr安装与整合中文分词IKAnalyzer: #### 整合IKAnalyzer进行中文分词 IKAnalyzer是一个针对中文的高效、准确的词法分析器，广泛应用于各种基于Java的应用系统中。 1. **下载IKAnalyzer** - 由于本例中使用的Solr版本为4.10，因此需要下载与之兼容的...

最新Solr环境搭建与IKAnalyzer3分词整合.doc: Solr 是一个基于 Lucene 的搜索服务器， IKAnalyzer 是一个开源的中文分词器，通过将其整合到 Solr 中，可以实现中文搜索的功能。一、Solr 环境搭建 Solr 环境搭建需要 JRE 环境的支持，因此我们首先需要安装 ...

solr6.x的IKAnalyzer整合: 在 Solr 中整合 IKAnalyzer 可以优化对中文文档的索引和查询性能。在 Solr 6.x 版本中整合 IKAnalyzer，主要涉及以下几个步骤： 1. **下载和准备 IKAnalyzer**：首先，你需要从官方网站或者 GitHub 下载 IK...

ikanalyzer-solr: 在Solr的`lib`目录下添加ikanalyzer的jar文件，确保Solr启动时能加载到该分词器。同时，还需要在Solr的`schema.xml`文件中配置分词器，指定字段类型为`text_ik`或`text_ik_max_word`，前者主要用于单个词语的查询，...

tomcat8.5+solr7+IKAnalyzer5: 描述中提到"已经整合IKAnalyzer中文分词, 直接使用即可"，这意味着开发者已经完成了将IKAnalyzer与Solr的集成工作，使得Solr具备了对中文文本的分词处理能力，用户可以直接在该环境中进行搜索和索引操作，无需额外的...

solr全文检索+IK分词器: 而IK分词器（Intelligent Chinese Analyzer for Solr）则是专门为Solr设计的中文分词组件，能有效地对中文文本进行切词，提升搜索的准确性和召回率。 **Solr全文检索** Solr的核心功能是全文检索，它基于倒排索引...

solr-7.7.2+ik-analyzer-solr7x.zip: 总之，"solr-7.7.2+ik-analyzer-solr7x.zip"提供了Solr 7.7.2版本与Ik Analyzer的整合，使得在处理中文搜索时，可以充分利用Solr的强大功能和Ik Analyzer的智能分词特性，为企业级的中文搜索应用提供高效、准确的...

solr5的中文分词器ik-analyzer-solr5-master.zip: **Solr5中文分词器IK Analyzer详解** IK Analyzer是一个广泛使用的开源中文分词器，尤其在搜索引擎领域，如Apache Solr和Elasticsearch中，它扮演着关键的角色。本项目"ik-analyzer-solr5-master.zip"是IK Analyzer...

IK Analyzer 2012FF_hf1: **在Windows或Linux下的集成** 表明IK Analyzer具有良好的平台兼容性，无论是开发环境还是生产环境，都可以轻松地将它整合到项目中。在Windows系统中，通常可以通过修改Solr的配置文件，将IK Analyzer指定为默认的...

lucene4.3.0+IK Analyzer2012FF: - **配置IK Analyzer**：在Lucene项目中，需要将IK Analyzer的jar包添加到类路径，并在配置文件中指定使用IKAnalyzer作为默认的分词器。 - **创建索引**：利用IK Analyzer进行中文文档的分词，然后使用Lucene的...

ikanalyzer-solr7.2.1.zip: 本资源"ikanalyzer-solr7.2.1.zip"正是针对Solr 7.2.1版本的IK Analyzer配置包，旨在帮助用户实现IK Analyzer与Solr的无缝对接，以便更好地处理中文语句的分词工作。首先，我们需要理解Solr的核心功能。Solr是...

模糊查询-lucene-IKAnalyzer: Lucene是一个高性能、全文本搜索库，而IKAnalyzer是一个专门针对中文分词的开源分析器，它们的结合能够有效地帮助我们处理中文文本的搜索需求。首先，我们需要了解Lucene的基本概念。Lucene提供了完整的搜索索引...

solr+IK分词集成tomcat实现全文检索: 4. **集成IK分词器**：下载IK分词器的jar包，将其添加到Solr的lib目录下。然后在`solrconfig.xml`中配置Analyzer部分，指定使用IK分词器。 5. **启动Solr**：启动Tomcat，Solr将在Tomcat中运行。通过访问`...

ElasticSearch+IKAnalyzer整合版解压即用: IKAnalyzer是一款开源的中文分词器，最初设计用于Solr，但后来也被广泛应用于Elasticsearch。它支持多种分词模式，包括精确模式、全模式、快速模式以及自定义词典。IKAnalyzer的优势在于其对中文词汇的精准识别，...

IKAnalyzer2.0.2: 总之，IKAnalyzer2.0.2是Java Lucene全文搜索环境下重要的中文分词工具，它为中文信息检索提供了便捷、高效和可定制化的解决方案，广泛应用于各种需要处理中文文本的搜索系统中。通过熟练掌握IKAnalyzer的使用，可以...

IK+Analyzer+2012FF_hf1 分词器全套使用下载: Solr是一个流行的开源搜索引擎，IK Analyzer可以与其无缝集成，为Solr提供强大的中文分词能力。在Solr配置中，可以指定使用IK Analyzer作为默认的分析器，以实现对中文文档的高效检索。 ### 3. 搜索引擎的应用在...

ik+mmseg分词器: 在 Solr 6.1 版本中，IK+MMSEG 分词器的整合意味着用户可以在享受 IK Analyzer 高效分词性能的同时，利用 MMSEG 的复杂词汇处理能力。这种组合可以处理各种复杂的中文文本，包括网络语言、专业术语等，对于提升搜索...

Global site tag (gtag.js) - Google Analytics