solr4.0加入中文分词IKanalry

iluoxuan

浏览: 584731 次
性别:
来自: 北京

最近访客更多访客>>

czl026

java_my_life

hejin_sl

yzzh9

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

java
lucene

1：solr4.0加入中文分词：

在IK的自带文档中有：

这里特别的罗嗦几句，在Solr4.0发布以后，官方取消了BaseTokenizerFactory接口，而直接使用Lucene Analyzer标准接口。因此IK分词器2012 FF版本也取消了org.wltea.analyzer.solr.IKTokenizerFactory类。

2：首先在tomcat不是的solr目录下lib中加入：

IKAnalyzer2012FF_u1.jar包

3：然后再solr目录C:\solr\collection1\conf下的schema.xml文件中加入：

</fieldType>

就可以了，在solr界面中analys选错 type下的 text就可以分词了

比如：

2：解释下，我在Ik的jar包中的dir字典加入了停用词：

中潭露。

查看图片附件

分享到：

bloom filter算法的Java 实现 | solr4.0在tomcat6下部署

2012-11-01 13:48
浏览 10559
评论(8)
分类:Web前端
查看更多

8 楼 Java_大猫 2013-03-07

baa 写道

iluoxuan 写道

好久 solr 没看了我都忘了...............

我已经找到了原因。是我对tomcat发布机制不熟悉造成的。war包增加jar包需要先解压。

你导入什么jar包了？我也报插件错误的那个问题了

7 楼 baa 2013-01-25

iluoxuan 写道

好久 solr 没看了我都忘了...............

我已经找到了原因。是我对tomcat发布机制不熟悉造成的。war包增加jar包需要先解压。

6 楼 iluoxuan 2013-01-24

好久 solr 没看了我都忘了...............

5 楼 baa 2013-01-24

mushuxiaoxiao 写道

你好，我用你的方法操作，有一个这样的错误collection1: org.apache.solr.common.SolrException:org.apache.solr.common.SolrException: Plugin init failure for [schema.xml] fieldType "text_zh":
Cannot load analyzer: org.wltea.analyzer.lucene.IKAnalyzer 。是不是我的配置有什么问题？
感谢您如果能回复！

跟你同样的错误。不知到该如何解决。

4 楼 hitliya 2012-12-25

您好，我用solr4.0添加了IK。但是您用的是tomcat的方式，我用的是solr自带的例子。（参考http://abloz.com/2012/07/02/apache-search-engine-solr-trial.html）。现在问题来了，我将IKAnalyzer2012FF_u1.jar放到solr/apache-solr-4.0.0/example/solr/collection1/lib下，IKAnalyzer.cfg.xml和 ext.dic（扩展词库）也放到该位置，但是扩展词库却不起作用。没有报错，只是分词没有按照扩展词库的要求去分词，您了解是怎么回事么？简化的说，就是不用tomcat，IKAnalyzer.cfg.xml和 ext.dic应该放在哪里？？谢谢啦！问题不难但是说不清楚，希望您能加我QQ：九八4419二一三，验证信息：祝天刚。谢谢

3 楼 iluoxuan 2012-11-15

这个你看下IK版本对不，版本对的话安装文档来是没错的

2 楼 mushuxiaoxiao 2012-11-12

问题已解决，要把jar包以及配置文件放到war包web_INF里的lib中。打扰！

1 楼 mushuxiaoxiao 2012-11-12

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论