1.增加IKAnalyzer2012FF_u1.jar包.
D:\tools\java\tomcat\apache-tomcat-6.0.20-solr\webapps\solr\WEB-INF\lib
2.增加分词处理
在目录D:\tools\java\tomcat\apache-tomcat-6.0.20-solr\solr_home\wangniu\conf\schema.xml
<types></types>中增加ik分词的type.
<!-- ikanalyze config -->
<fieldType name="text_ik" class="solr.TextField">
<analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
<analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>
3.注意词库编码,否则词库不启作用
注意修改文件stopword.dic,ext.dic的编码方式为无BOM的UTF-8编码方式
http://blog.csdn.net/shihuacai/article/details/8494360
相关推荐
下面我们将详细讨论如何将 Solr 3.5 版本整合到 Tomcat 中。 首先,我们需要了解 Solr 3.5 的主要特性。这个版本包含了对搜索性能的优化,改进了处理大量数据的能力,并且引入了一些新的查询过滤器和排序选项。同时...
### Solr 4.10.2 与 Tomcat 6 的整合详解 #### 一、Solr 与 Tomcat 整合概述 Solr 是一个高性能、采用 Java 开发的全文搜索引擎,常用于网站搜索功能的搭建。而 Apache Tomcat 是一个免费开源的 Servlet 容器,...
《深入理解Lucene4、Solr4J与AriK4:构建高效全文搜索引擎》 在信息化时代,数据量呈爆炸性增长,如何快速、准确地检索信息成为了一个至关重要的问题。为此,开源社区提供了强大的全文搜索引擎框架——Lucene4,...
本教程将详细介绍如何在Tomcat 8.0中整合Solr 8.0,并配置IK分词器,以实现更精准的中文分词搜索。 首先,我们需要了解Tomcat和Solr的基本概念。Tomcat是Apache软件基金会的Jakarta项目中的一个核心项目,它遵循...
Apache Solr 4 Cookbook Apache Solr 4 Cookbook Apache Solr 4 Cookbook Apache Solr 4 Cookbook Apache Solr 4 Cookbook
标题“solr与tomcat整合”涉及的是将Apache Solr搜索引擎集成到Apache Tomcat应用服务器的过程。Solr是一款基于Lucene的开源搜索平台,而Tomcat是Java Servlet和JavaServer Pages的容器。整合这两者可以方便地在Web...
4. **配置Solr**:在Solr的`solr_home`目录下创建或修改配置文件,如`solrconfig.xml`和`schema.xml`,根据项目需求定制索引和查询行为。 5. **启动Tomcat**:运行Tomcat的`bin/startup.bat`脚本来启动服务。如果...
4. 启动Tomcat,通过浏览器访问Solr的管理界面,验证是否成功启动。 5. 学习Solr的API,理解如何通过HTTP请求进行索引创建、更新和查询操作。 6. 使用提供的开发教程来深入理解Solr的功能和最佳实践。 通过这个资源...
标题中的"solr ssm java"表明这是一个使用Java语言,结合Spring、SpringMVC和MyBatis(SSM)框架的项目,其中整合了Apache Solr搜索引擎。让我们深入了解一下这些技术及其相互作用。 **Solr**: Apache Solr是基于...
这个压缩包"solr 4-10.3 工具包 包含工程jar包"显然包含了Solr 4.10.3版本的相关组件和库,这对于开发者来说是极其宝贵的资源,特别是那些在Java环境下工作并需要构建或扩展Solr应用的人。 Solr 4.10.3是一个重要的...
1. **复制 log4j.properties 文件**:将 `D:\solr\solr-4.7.2\example\resources` 下的 log4j.properties 文件复制到 `D:\solr\tomcat7\webapps\solr\WEB-INF\classes` 目录。 #### 七、配置 web.xml 文件 1. **...
4. **修改配置**: 打开`solr.xml`配置文件,设置Solr的核心路径和端口。同时,确保Tomcat的`server.xml`文件中的Connector配置正确,以便Solr可以通过HTTP/HTTPS进行访问。 5. **部署到Tomcat**: 将`solr.war`文件...
4. **部署到Tomcat**:将解压后的Solr 3.5的web应用程序目录复制到Tomcat的webapps目录下,通常命名为`solr`。 5. **配置Solr服务器**:可能需要修改`solrconfig.xml`以适应特定的需求,例如设置数据源、缓存策略...
<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word" dicPath="dic"/> <fieldType name="textSimple" class="solr.TextField"> <tokenizer class="com.chenlb.mmseg4j.solr....
《mmseg4j在Solr中的应用与实践》 在信息检索和文本处理领域,中文分词是至关重要的一步,它决定了文本理解的准确性。在Java环境下,mmseg4j是一个广泛使用的开源中文分词库,它为Java开发者提供了强大的中文处理...
Solr如何进行索引和搜索 索引:客户端(可以是浏览器可以是java程序)发送post请求到solr服务器,发给solr服务器一个文档(xml、json),就可以进行一个添加索引删除索引、修改索引的操作。 搜索:客户端(可以是...
"兼容solr4.10.3的mmseg4j-1.9.1分词器" 这个标题表明我们正在讨论的是一个针对Solr 4.10.3版本优化的mmseg4j分词器,版本号为1.9.1。mmseg4j是一款广泛使用的Java实现的中文分词库,它提供了高效且精准的中文分词...
本文将详细介绍如何将mmseg4j最新版的jar文件完美地整合到Solr-5.3.0中,以实现更高效的中文分词功能。 首先,mmseg4j-solr-2.3.1-SNAPSHOT.jar和mmseg4j-core-1.10.1-SNAPSHOT.jar是mmseg4j的核心组件,分别提供了...