solr1.4+IKAnalyzer配置
solr1.4,分词采用IKAnalyzer最新,servlet采用tomcat6
1、修改tomcat目录下conf下的server.xml,查找8080,然后uriencoding=utf-8
完整的配置如下:
<Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" URIEncoding="UTF-8" />
2、部署solr,在tomcat目录下新建 conf/Catalina/localhost/solr.xml,如果没有,就自己创建。solr.xml里内容是
<Context docBase="/mywork/dist/apache-solr-1.4.0.war" debug="0" crossContext="true" > <Environment name="solr/home" type="java.lang.String" value="/mywork/data/solr" override="true" /> </Context>
"/mywork/data/apache-solr-1.4.0.war"
和 “/mywork/data/solr” 请根据自己实际情况修改。apache-solr-1.4.0.war在你solr的dist文件夹中找到,后者表示索引位置。
3:给于tomcat/bin下权限 chmod 700 *。
4:运行tomcat/bin/startup.sh,,,如果java环境配置都没问题,,那么你可以直接访问http://localhost:8080/solr/admin
5: 此时还不支持中文分词,停用tomcat(运行tomcat/bin/shutdown.sh),在tomcat的webapps里找到solr文件夹,在WEB-INF的lib目录里加入IKAnalyzer3.2.0Stable.jar。然后到solr的example目录下solr/conf/找到schema.xml ,增加text_cn这个新field
然后就可以应用这个类型,,比如修改该schema里面的
原来是
<field name="sku" type="textTight" indexed="true" stored="true" omitNorms="true"/>
改成
<field name="sku" type="text_cn" indexed="true" stored="true" omitNorms="true"/>
6:
保存完毕,测试下。启动tomcat,打开http://localhost:8080/solr/admin/analysis.jsp,,然后测试。。
图片不上传了,文字说下,field这里的下拉改成type,,对应的input框里打入text_cn,
fieldvalue这里两个选择框都打勾,对应的input框里随便你输入什么中文语句。
点“Analyzer”按钮,应该就能看到ik分词信息了。
分享到:
相关推荐
对solr1.4提供接口实现 使用IK分词器,应为该集群使用到的solr版本为4.10.3-cdh5.7.5,所以使用的 IK 包为IKAnalyzer2012FF_u1.jar,如果是3x的solr,使用IKAnalyzer2012_u6.jar solr-4.10.3下载地址:...
对solr1.4提供接口实现 使用IK分词器,应为该集群使用到的solr版本为4.10.3-cdh5.7.5,所以使用的 IK 包为IKAnalyzer2012FF_u1.jar,如果是3x的solr,使用IKAnalyzer2012_u6.jar 具体操作如下: 引用 1.在/opt/...
IKAnalyzer2012还兼容Lucene 3.3以上版本,并为Solr 1.4提供了接口实现。 安装部署方面,IKAnalyzer的安装包包括了必要的文件和文档,方便用户进行安装和配置。文档还提醒用户注意,由于是通过OCR扫描技术从纸质...
IKAnalyzer3.X的安装包包含了必要的文档、主JAR包、配置文件以及扩展停用词词典,用户可根据指南轻松完成部署,实现即刻使用。 总之,IKAnalyzer V3.2.0不仅在分词性能上达到了业界领先水平,而且在灵活性、兼容性...
IKAnalyzer的安装包包含了《IKAnalyzer中文分词器V3.X使用手册》,其中详细介绍了如何安装配置IKAnalyzer。此外,还需要注意的是,IKAnalyzer的具体安装步骤可能会因版本不同而有所差异,建议仔细阅读官方文档以确保...
将`IKAnalyzer.jar`文件添加到`apache-tomcat-8.0.47/webapps/solr/WEB-INF/lib`目录中,并将扩展词典及停用词词典复制到工程的classpath中。注意,这些词典文件必须使用UTF-8编码。 **2.2 配置fileType** 在`solr...
Solr支持多种中文分词器,如IKAnalyzer、SmartChineseAnalyzer等。正确配置中文分词器能显著提高中文文本的搜索准确度和效率。 #### 结论 Solr是一个功能强大、高度可定制的企业级搜索平台,基于Lucene构建,但...
4. **IK分词器**:`ikanalyzer-solr6.5.zip` 提供了IK分词器,它是中国最流行的Java语言分词库,适用于中文和其他东亚语言的全文检索。IK分词器在Solr中用于对中文文本进行精细化的分词处理,提升搜索精度。 5. **...
AutoTips是为解决应用系统对于【自动提示】的需要(如:Google搜索), 而开发的架构无关的公共控件, 以满足该类需求可以通过快速配置来开发。AutoTips基于搜索引擎Apache Lucene实现。AutoTips提供统一UI。 WAP浏览器...
AutoTips是为解决应用系统对于【自动提示】的需要(如:Google搜索), 而开发的架构无关的公共控件, 以满足该类需求可以通过快速配置来开发。AutoTips基于搜索引擎Apache Lucene实现。AutoTips提供统一UI。 WAP浏览器...
AutoTips是为解决应用系统对于【自动提示】的需要(如:Google搜索), 而开发的架构无关的公共控件, 以满足该类需求可以通过快速配置来开发。AutoTips基于搜索引擎Apache Lucene实现。AutoTips提供统一UI。 WAP浏览器...
AutoTips是为解决应用系统对于【自动提示】的需要(如:Google搜索), 而开发的架构无关的公共控件, 以满足该类需求可以通过快速配置来开发。AutoTips基于搜索引擎Apache Lucene实现。AutoTips提供统一UI。 WAP浏览器...
AutoTips是为解决应用系统对于【自动提示】的需要(如:Google搜索), 而开发的架构无关的公共控件, 以满足该类需求可以通过快速配置来开发。AutoTips基于搜索引擎Apache Lucene实现。AutoTips提供统一UI。 WAP浏览器...
AutoTips是为解决应用系统对于【自动提示】的需要(如:Google搜索), 而开发的架构无关的公共控件, 以满足该类需求可以通过快速配置来开发。AutoTips基于搜索引擎Apache Lucene实现。AutoTips提供统一UI。 WAP浏览器...
AutoTips是为解决应用系统对于【自动提示】的需要(如:Google搜索), 而开发的架构无关的公共控件, 以满足该类需求可以通过快速配置来开发。AutoTips基于搜索引擎Apache Lucene实现。AutoTips提供统一UI。 WAP浏览器...
AutoTips是为解决应用系统对于【自动提示】的需要(如:Google搜索), 而开发的架构无关的公共控件, 以满足该类需求可以通过快速配置来开发。AutoTips基于搜索引擎Apache Lucene实现。AutoTips提供统一UI。 WAP浏览器...
AutoTips是为解决应用系统对于【自动提示】的需要(如:Google搜索), 而开发的架构无关的公共控件, 以满足该类需求可以通过快速配置来开发。AutoTips基于搜索引擎Apache Lucene实现。AutoTips提供统一UI。 WAP浏览器...
AutoTips是为解决应用系统对于【自动提示】的需要(如:Google搜索), 而开发的架构无关的公共控件, 以满足该类需求可以通过快速配置来开发。AutoTips基于搜索引擎Apache Lucene实现。AutoTips提供统一UI。 WAP浏览器...
AutoTips是为解决应用系统对于【自动提示】的需要(如:Google搜索), 而开发的架构无关的公共控件, 以满足该类需求可以通过快速配置来开发。AutoTips基于搜索引擎Apache Lucene实现。AutoTips提供统一UI。 WAP浏览器...