`
- 浏览:
40992 次
- 性别:
- 来自:
北京
-
solr4.6.0安装部署以及配置中文分词IKAnalyzer
一定要看Changes.html
solr从4.8之后支持jdk只能是1.7以上了。
也就是说4.7.2是当前支持jdk1.6的最高版本了。
坑了一天时间,就是因为版本不对。
一,solr安装部署
1, 解压tomcat,修改tomcat的端口和编码:apache-tomcat-7.0.47\conf\server.xml
<Server port="8805" shutdown="SHUTDOWN">
<Connector port="8880" protocol="HTTP/1.1"
connectionTimeout="20000"
edirectPort="8443" URIEncoding="UTF-8"/>
<Connector port="8809" protocol="AJP/1.3" redirectPort="8443" />
2, 解压solr,拷贝\solr-4.6.0\dist\solr-4.6.0.war到apache-tomcat-7.0.47\webapps\下修改solr-4.6.0.war为solr.war
3,启动tomcat让tomcat,tomcat会吧solr.war解压为solr文件夹,然后删除除了solr文件夹的其它所有文件只留下solr文件夹
4,拷贝solr-4.6.0\dist\*.jar和solr-4.6.0\dist\solrj-lib\*.jar到apache-tomcat-7.0.47\webapps\solr\WEB-INF\lib下
5,拷贝solr-4.6.0\example下solr文件夹到\apache-tomcat-7.0.47目录下
6,在apache-tomcat-7.0.47\conf\Catalina\localhost下面建配置文件solr.xml内容如下:
<?xml version="1.0" encoding="UTF-8" ?>
<Context docBase="需要修改为你的路径/apache-tomcat-7.0.47/webapps/solr" debug="0" crossContext="true">
<Environment name="solr/home" type="java.lang.String" value="需要修改为你的路径/apache-tomcat-7.0.47/solr" override="true"/>
</Context>
7,重启tomcat
8,访问http://localhost:8880/solr页面
二, solr配置中文分词IKAnalyzer
注意的是:http://code.google.com/p/ik-analyzer/downloads/list这个网站下载IK Analyzer 2012FF_hf1.zip
如果使用的solr是4.0以上一定要下载这个,其他的不能用,至少现在是这样的。
1,解压 IK Analyzer 2012FF_hf1.zip文件
2,创建\apache-tomcat-7.0.47\webapps\solr\WEB-INF下创建classes文件夹
3,拷贝IK Analyzer 2012FF_hf1下的IKAnalyzer.cfg.xml和stopword.dic到\apache-tomcat-7.0.47\webapps\solr\WEB-INF\classes下
4,拷贝IK Analyzer 2012FF_hf1下的IKAnalyzer2012FF_u1.jar到\apache-tomcat-7.0.47\webapps\solr\WEB-INF\lib下
5,修改apache-tomcat-7.0.47\solr\collection1\conf\schema.xml文件,添加如下内容:
<fieldType name="zh_of_ik" class="solr.TextField">
<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>
6,重启tomcat
7,访问http://localhost:8880/solr页面
查看collection1---Analysis
Field Value (Index)
输入:Solr是一个企业级应用的搜索引擎服务器
Analyse Fieldname / FieldType选择:
zh_of_ik
说明配置成功
需要注意的问题:
1,后来发现solr4.6.0在索引的时候会报utf-8错误,这是solr4.6.0的一个bug(在solr的bug系统上有记录),后来降到4.5.1,配置是同样的。
2,打开http://localhost:8880/solr页面使用firefox浏览器,ie8查询的时候有错误。
有空补充schema.xml的配置和如何做索引以及查询(问题真是多)
分享到:
Global site tag (gtag.js) - Google Analytics
相关推荐
ikanalyzer 是一个专门为Java开发的中文...总之,ikanalyzer-solr8.4.0 是 Solr 8.4.0 版本下用于中文分词的重要工具,通过合理的配置和使用,可以显著提高 Solr 对中文文本的处理能力,从而提升搜索质量和用户体验。
适应solr5.x的中文分词IKAnalyzer
### Solr安装与整合中文分词IKAnalyzer ...通过以上步骤,不仅完成了Solr的基本安装配置,还成功地集成了IKAnalyzer,实现了对中文文本的有效分词处理,这对于处理中文数据的全文检索应用来说非常重要。
标题 "solr5.5.x的中文分词IKAnalyzer" 指的是在Apache Solr 5.5.x版本中使用IKAnalyzer进行中文文本的分词处理。Solr是一款流行的开源搜索服务器,它允许对大量数据进行高效、复杂的全文检索。而中文分词是中文文本...
IKAnalyzer是针对中文分词的一个著名开源工具,特别适用于Solr的中文处理。"solr分词 IKAnalyzer2012FF_hf1.rar" 包含的是一个针对Solr优化的IK分词器版本,即IKAnalyzer2012FF_hf1。这个版本在原版IKAnalyzer的基础...
4. **与Solr的整合**:Ik Analyzer为Solr提供了专门的配置,可以无缝对接,实现对Solr索引的中文分词处理。 在实际应用中,Ik Analyzer的集成步骤大致如下: 1. **下载与解压**:获取ik-analyzer-7.5.0.jar文件,...
IKAnalyzer在Solr中的集成使得用户可以方便地在Solr中使用它进行中文文本的预处理,包括分词、去停用词等步骤,这对于提高搜索的准确性和效率至关重要。在Solr7.x版本中,IKAnalyzer可能已经针对该版本的特性和需求...
IKAnalyzer中文分词器本身已经不支持最新的solr 5,集成到solr中分词会报错,这里将解决了solr 5支持问题的最新IK包共享出来,希望能帮到各位! 附上IK在schema.xml中的配置: <fieldType name="text_ik" class=...
描述中提到的"solr中文分词器 IKAnalyzer 支持solr版本5.x到7.x 亲测可用,我用的是7.2版本"进一步证实了IKAnalyzer在Solr 7.2版本中的实际应用,这为其他用户提供了信心,确保了在不同Solr版本下的稳定运行。...
ikanalyzer-solr6.5 是一个专门为Solr 6.5版本设计的中文分词器,它基于ikanalyzer,并且进行了优化以更好地适应Solr的索引和搜索需求。ikanalyzer是一个开源的、基于Java实现的中文分词库,主要用于解决中文文本...
Solr是一款强大的全文搜索引擎,广泛...总的来说,正确配置ikanalyzer是提升Solr中文搜索性能的关键步骤。通过上述步骤,你应该能在Solr 6.0环境中成功使用ikanalyzer进行中文分词,为你的应用提供更精准的搜索体验。
在Solr6.0及以上版本中,为了更好地支持中文分词,我们可以配置IKAnalyzer(智能中文分析器)。IKAnalyzer是一个专门针对中文的开源分词器,设计目标是提供一个灵活且易扩展的中文分词组件。 **IKAnalyzer简介** IK...
Solr是Apache Lucene项目的一个开源搜索引擎服务器,它提供了全文检索、...总之,配置IKAnalyzer智能分词对于提升Solr在处理中文数据时的检索效果至关重要。理解并正确配置这些步骤,可以显著改善你的搜索引擎的性能。
总之,ikanalyzer-solr5 是为了满足 Solr 用户对中文分词的需求而设计的,它简化了 Solr 中文处理的集成过程,并提供了灵活的配置选项,以便更好地适应各种文本分析场景。通过正确配置和使用,ikanalyzer 可以显著...
Solr 是一个开源的全文搜索服务器,由 Apache Lucene 提供支持,被广泛应用于构建高效、可扩展的搜索应用。5.4.0 版本是 Solr 的一个重要...记住,理解和掌握 Solr 的核心配置以及分词器的使用是实现这一目标的关键。
文件中包括:1:solr4.4.0安装部署详细文档,solr-4.4.0.tgz 安装包2:ik分词器详细配置,IKAnalyzer2012FF_u1.jar和IKAnalyzer2012_FF.jar包3:solr和数据库实现实时数据同步更新,以及更新索引。solr-...
通过研究Solr 4.6.0的源代码,开发者可以深入理解其内部工作原理,定制化搜索服务,优化性能,以及解决在部署和使用过程中遇到的问题。这不仅有助于提升对全文检索技术的理解,也有利于开发更加高效和个性化的搜索...
《ikanalyzer-solr:Solr的中文分词利器》 在信息检索和文本分析领域,中文分词是至关重要的一步,它能够将连续的汉字序列切分成具有语义的词汇单元,为后续的文本处理提供基础。ikanalyzer-solr正是一款专为Apache...
在Cloudera平台下安装Solr分词器的教程可能是指导用户如何在基于Hadoop的Cloudera环境中部署和配置Solr,包括如何将IK Analyzer集成到Solr的schema.xml文件中,以及如何启动和测试分词器。这通常涉及到添加库依赖、...