`
Luob.
  • 浏览: 1589964 次
  • 来自: 上海
社区版块
存档分类
最新评论

solr 4.0 集成 IK Analyzer 中文分词

    博客分类:
  • solr
阅读更多
环境
jdk 1.7
tomcat1.7
solr 4.10
IK Analyzer 2012FF_hf1.zip

solr的下载
官网http://lucene.apache.org/solr/
下载:http://www.eu.apache.org/dist/lucene/solr/

IK Analyzer下载 (找个免费 VPN 翻)
google Code:https://code.google.com/p/ik-analyzer/downloads/list
尤其要注意 IK Analyzer 支持的 solr 版本
我们这里下载 IK Analyzer 2012FF_hf1.zip



部署solr到tomcat中

//1.修改tomcat 的编码格式   
cd   C:\Tomcat 6.0\conf\server.xml
加上   URIEncoding="UTF-8"
 <Connector port="8080" protocol="HTTP/1.1" 
               connectionTimeout="20000" 
               redirectPort="8443" URIEncoding="UTF-8" />

//2.拷贝 E:\solr\apache-solr-3.6.2\example\webapps\solr.war 到 C:\Tomcat 6.0\webapps

//3.配置solr.home
在  C:\Tomcat 6.0\conf\Catalina\localhost 新建 solr.xml

<?xml version="1.0" encoding="UTF-8"?>
<Context docBase="C:\Tomcat 6.0\webapps\solr.war" debug="0" crossContext="true">
	<Environment name="solr/home" type="java.lang.String" value="E:\solr\apache-solr-3.6.2\example\solr" override="true"/>
</Context>

//3.5配置 solr.home 的 方法二
修改 solr.war 中的  web.xml   添加 如下配置 也可以(一般web.xml中已经包含了只需取消注释就可以了)
<env-entry>
       <env-entry-name>solr/home</env-entry-name>
       <env-entry-value>E:\solr\apache-solr-3.6.2\example\solr</env-entry-value>
       <env-entry-type>java.lang.String</env-entry-type>
</env-entry>

然后重新打包 
java -cvf  solr.war  *.*  将 解压后的sole.war  重新打包部署

//4.启动 tomcat就 然后 访问 http://localhost:8080/solr/admin

//5 进入控制台   默认使用  "*:*" 查询所有 文档   这个 可以在  E:\solr\apache-solr-3.6.2\example\solr\conf\solrconfig.xml 中 修改
 <defaultQuery>*:*</defaultQuery>  一般 不建议修改 



集成 IK Analyzer 2012FF_hf1


// 复制  IKAnalyzer2012FF_u1.jar 到 tomcat/webappa/solr/web-inf/lib
// 复制 IKAnalyzer.cfg.xml 和 stopword.dic 到上面配置的 solr/home/solr/core0/conf/
或者 到 \example\solr\core0\conf 下面


打开 \example\solr\core0\conf 或者 solr/home/solr/core0/conf/ 下面的schema.xml 配置文件 
在 <types>下加入
 <!-- IK Analyzer-->
<fieldType name="text_ik" class="solr.TextField"> 
<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/> 
</fieldType>

在  
<fields> 中加入
 <field name="text" type="text_ik" indexed="true" stored="false" multiValued="false"/> 

重启 tomcat 然后访问
http://localhost:8983/solr/#/core0/analysis





  • 大小: 25.2 KB
  • 大小: 443.7 KB
  • 大小: 232.9 KB
分享到:
评论

相关推荐

    ikanalyzer-solr8.4.0_solr8_solr_ikanalyzer_中文分词_

    在 Solr 环境中,ikanalyzer 的作用是为中文文档提供精确的分词服务,从而提升搜索质量和效率。Solr8.4.0 是 Apache Solr 的一个版本,这是一个高度可配置、高性能的全文搜索和分析引擎,广泛用于构建企业级搜索应用...

    支持solr 5.3.0的IKAnalyzer中文分词器

    IKAnalyzer中文分词器本身已经不支持最新的solr 5,集成到solr中分词会报错,这里将解决了solr 5支持问题的最新IK包共享出来,希望能帮到各位! 附上IK在schema.xml中的配置: &lt;fieldType name="text_ik" class=...

    Solr6.0集成IK-Analyzer分词器

    在Solr中集成IK Analyzer,能够更好地对中文内容进行索引和搜索,提高查询效率和准确性。 **Solr6.0集成IK Analyzer的过程主要包括以下几个步骤:** 1. **下载和安装** - 首先,你需要下载最新版本的Solr6.0和IK ...

    solr5 IK-Analyzer中文分词

    solr5 IK-Analyzer中文分词。jar里面有IKAnalyzer.cfg.xml、stopword.dic

    ik-analyzer-solr7.zip

    在描述中提到的"ik-analyzer-solr7.zip"是一个专门为Apache Solr 7.x版本定制的IKAnalyzer分词器插件。Solr是Apache软件基金会的一个项目,它是一款强大的全文搜索服务器,提供了诸如索引、搜索、高亮显示、拼写检查...

    ikanalyzer中文分词支持lucene7.1.0

    ikanalyzer中文分词支持lucene7.1.0是一个针对Lucene搜索引擎的中文分词扩展,由林良益先生开发,旨在提供高效、精准的中文词汇拆解功能。Lucene是一个开源全文检索库,它提供了索引和搜索文本的强大工具。然而,...

    支持solr5.5 solr6.0中IK分词需要的资料

    Solr是中国最流行的全文...通过以上步骤和注意事项,你应该能够成功地在Solr 5.5和6.0中集成和使用IK分词器,从而提升中文文本的检索效果。所提供的资料将有助于这个过程,帮助你解决可能出现的问题和优化分词性能。

    IKAnalyzer中文分词器

    IKAnalyzer是一款专为中文处理设计的开源分词器,它主要应用于搜索引擎、信息检索系统、文本挖掘等领域。这款工具能够高效地对中文文本进行分词,使得计算机可以更好地理解和处理中文信息。IKAnalyzer的名字来源于...

    solr配置ikanalyzer分词文件以使用说明

    在这个说明中,我们将详细讲解如何在Solr 6.0中配置ikanalyzer分词文件,以实现对中文文本的有效处理。 1. **ikanalyzer简介** ikanalyzer是一款专门为Java语言设计的开源中文分词库,它基于Apache Lucene项目,...

    solr 5.4.0 完整包,包含ikanalyzer 中文分词器

    对于中文搜索,ikanalyzer 的集成使得 Solr 能够更好地处理中文分词问题,提高了中文文本检索的准确性和效率。同时,Solr 的灵活性和可扩展性也使得它成为了企业级搜索解决方案的首选。 总之,Solr 5.4.0 与 ik...

    IKAnalyzer中文分词器v2012使用手册.pdf

    标题:"IKAnalyzer中文分词器v2012使用手册" 所述的知识点包括: IKAnalyzer是一款开源的基于Java语言开发的轻量级中文分词工具包,最早版本于2006年12月发布。作为一个文本分析组件,它最初是作为开源项目Lucene的...

    solr5.x(含5.4)可用的ikanalyzer中文分词

    solr5.x(含5.4)可用的ikanalyzer中文分词 &lt;fieldType name="text_ik" class="solr.TextField"&gt; &lt;analyzer type="index"&gt; &lt;tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" /&gt; ...

    solr-IKAnalyzer5分词器需要的依赖.zip

    solr-ik中文分词器资源包,包括ext.dic,,IKAnalyzer.cfg.xml,,ik-analyzer-solr5-5.x.jar,,managed-schema,,solr-analyzer-ik-5.1.0.jar,,stopword.dic solr-ik分词 solr中文分词 ik分词资源

    IKAnalyzer中文分词器 java

    IKAnalyzer是一款针对中文的开源分词器,专为Java平台设计。它在处理中文文本时,能够有效地进行词语切分,提升文本分析的准确性和效率。这个工具在信息检索、自然语言处理、文本挖掘等领域有着广泛的应用。 1. **...

    IKAnalyzer 中文分词demo

    7. **与其他框架的集成**:IKAnalyzer可以方便地与Lucene、Solr、Elasticsearch等全文检索框架集成,为这些系统提供强大的中文分词能力。 通过这个"IKAnalyzer中文分词demo",开发者不仅可以了解IKAnalyzer的基本...

    solr中文分词jar包ik-analyzer 含class配置 ik-analyzer-7.5.0

    Ik Analyzer是一款针对Java平台设计的、专门用于中文分词的开源工具,它在Solr中扮演着至关重要的角色。 标题提到的"ik-analyzer 7.5.0"是Ik Analyzer的一个特定版本,这个版本包含了对Solr的支持,并且提供了类...

    IKAnalyzer中文分词器V2012使用手册_20190806.pdf

    IKAnalyzer是一个开源的中文分词器,基于Java语言开发,它是一个轻量级的中文分词工具包。IKAnalyzer自2006年12月推出1.0版本以来,已经发展到了2012版本。这个分词器最初是基于开源项目Lucene的词典分词和文法分析...

    IKAnalyzer中文分词器V3.2使用

    **IKAnalyzer中文分词器V3.2使用详解** IKAnalyzer是一款开源的、适用于Java环境的中文分词器,主要用于解决在信息检索、文本挖掘等领域中遇到的中文处理问题。这款分词器的设计目标是提高分词的准确率,并且具有...

Global site tag (gtag.js) - Google Analytics