solr 5.0搭建和使用 ik分词 -

gjp014

浏览: 275629 次
性别:
来自: 天津

最近访客更多访客>>

Cyen

maxer025

bing_it

dluccoo

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

solr 5.0搭建和使用 ik分词

博客分类：

分布式技术

solr5 分词

1.将下载来的solr-5.0.0.zip解压。
创建D:\mysoftsetup\solrserver目录，复制solr-5.0.0\server\solr下所有文件到D:\mysoftsetup\solrserver，
复制Tomcat 到 D:\mysoftsetup\solrserver 目录

把solr-5.0.0\server\webapps\solr.war放到tomcat的webapps目录下；启动tomcat自动解压得到solr文件夹。
把solr-5.0.0\server\lib\ext下所有的jar，复制到刚才得到的solr文件夹下的WEB-INF\lib目录下。
把solr-5.0.0\server\resources\log4j.properties复制到webapps\solr\WEB-INF\classes目录下。
修改webapps\solr\WEB-INF\web.xml的：
   <env-entry>
       <env-entry-name>solr/home</env-entry-name>
       <env-entry-value>../../solr</env-entry-value>
       <env-entry-type>java.lang.String</env-entry-type>
    </env-entry>
指定solr/home为../../solr目录(其实就是：D:\mysoftsetup\solrserver目录中的solr)。

启动tomcat ,访问http://localhost:8393
查看信息：

建立core
把D:\mysoftsetup\solr-5.0.0\example\techproducts\solr\techproducts 复制到D:\mysoftsetup\solrserver\solr 中，techproducts修改为shop_goods,重新启动tomcat

2.使用ik和smartcn 中文分词
复制 solr-5.0.0\contrib\analysis-extras\lucene-libs 下的jar 到Tomcat 中solr/WEB-INF\lib 中，把附件中ik-analyzer-solr5-5.x.jar 也要复制到Tomcat 中solr/WEB-INF\lib 中
3.修改shop_goods中的schema.xml 中添加ik和smartcn 的配置

<fieldType name="text_smart" class="solr.TextField" positionIncrementGap="100">
          <analyzer type="index">
            <tokenizer class="solr.SmartChineseSentenceTokenizerFactory"/>
            <filter class="solr.SmartChineseWordTokenFilterFactory"/>
          </analyzer>
          <analyzer type="query">
            <tokenizer class="solr.SmartChineseSentenceTokenizerFactory"/>
            <filter class="solr.SmartChineseWordTokenFilterFactory"/>
          </analyzer>
    </fieldType>

<field name="text_smart_ceshi" type="text_smart" indexed="true" stored="true" multiValued="true"/>

<fieldType name="text_ik" class="solr.TextField">
          <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
          <analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
    </fieldType>

<field name="text_ik_ceshi" type="text_ik" indexed="true" stored="true" multiValued="true"/>

4.重启tomcat测试切词
在左侧选择shop_goods,然后单击“analysis”