solr 4.0 集成 IK Analyzer 中文分词

Luob.

浏览: 1594727 次
来自: 上海

最近访客更多访客>>

Jameslyy

apex53

smith6851

xiaoliefengfeng

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

solr

tomcat solr4.xx Ik Analyzer 中文分词

环境
jdk 1.7
tomcat1.7
solr 4.10
IK Analyzer 2012FF_hf1.zip

solr的下载
官网http://lucene.apache.org/solr/
下载:http://www.eu.apache.org/dist/lucene/solr/

IK Analyzer下载 (找个免费 VPN 翻)
google　Code:https://code.google.com/p/ik-analyzer/downloads/list
尤其要注意 IK Analyzer 支持的 solr 版本
我们这里下载 IK Analyzer 2012FF_hf1.zip

部署solr到tomcat中


//1.修改tomcat 的编码格式   
cd   C:\Tomcat 6.0\conf\server.xml
加上   URIEncoding="UTF-8"
 <Connector port="8080" protocol="HTTP/1.1" 
               connectionTimeout="20000" 
               redirectPort="8443" URIEncoding="UTF-8" />

//2.拷贝 E:\solr\apache-solr-3.6.2\example\webapps\solr.war 到 C:\Tomcat 6.0\webapps

//3.配置solr.home
在  C:\Tomcat 6.0\conf\Catalina\localhost 新建 solr.xml

<?xml version="1.0" encoding="UTF-8"?>
<Context docBase="C:\Tomcat 6.0\webapps\solr.war" debug="0" crossContext="true">
	<Environment name="solr/home" type="java.lang.String" value="E:\solr\apache-solr-3.6.2\example\solr" override="true"/>
</Context>

//3.5配置 solr.home 的 方法二
修改 solr.war 中的  web.xml   添加 如下配置 也可以(一般web.xml中已经包含了只需取消注释就可以了)
<env-entry>
       <env-entry-name>solr/home</env-entry-name>
       <env-entry-value>E:\solr\apache-solr-3.6.2\example\solr</env-entry-value>
       <env-entry-type>java.lang.String</env-entry-type>
</env-entry>

然后重新打包 
java -cvf  solr.war  *.*  将 解压后的sole.war  重新打包部署

//4.启动 tomcat就 然后 访问 http://localhost:8080/solr/admin

//5 进入控制台   默认使用  "*:*" 查询所有 文档   这个 可以在  E:\solr\apache-solr-3.6.2\example\solr\conf\solrconfig.xml 中 修改
 <defaultQuery>*:*</defaultQuery>  一般 不建议修改

集成 IK Analyzer 2012FF_hf1

// 复制  IKAnalyzer2012FF_u1.jar 到 tomcat/webappa/solr/web-inf/lib
// 复制 IKAnalyzer.cfg.xml 和 stopword.dic 到上面配置的 solr/home/solr/core0/conf/
或者 到 \example\solr\core0\conf 下面


打开 \example\solr\core0\conf 或者 solr/home/solr/core0/conf/ 下面的schema.xml 配置文件 
在 <types>下加入
 <!-- IK Analyzer-->
<fieldType name="text_ik" class="solr.TextField"> 
<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/> 
</fieldType>

在  
<fields> 中加入
 <field name="text" type="text_ik" indexed="true" stored="false" multiValued="false"/>

重启 tomcat 然后访问
http://localhost:8983/solr/#/core0/analysis