`
cxshun
  • 浏览: 724119 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

solr初体验(1)

阅读更多

由于工作原因,这段时间接触到solr,一个基于lucene的企业级搜索引擎。不怎么了解它的童鞋可以去GOOGLE一下。

下面开始正题:

1)要开始solr的学习,首先当然是要下载它啦(这是一句废话),可以到http://www.apache.org/dyn/closer.cgi/lucene/solr/这里去下载,最新的是1.4.1。下完后当然要解压啦(这也是废话)。我们看到它的结构是这样的。


 相信搞JAVA的同志们应该都大概了解对应的文件夹的意思啦,在dist里面是它的一些JAR包,当中包含了一个war包,这个是我们做例子时用到的项目。直接把它丢到tomcat的webapps里面去。

example目录里面有一些solr的索引数据,它自带了一个jetty方便运行,可以直接运行java -jar start.jar就可以运行jetty,但jetty的默认端口是8983,这个是跟tomcat不同的地方,要注意啦。

2)搞定了这些之后,那么我们应该继续来试运行一下这个东西啦。solr最重要的东西就是solr home,这个东西指定了solr建立的索引文件的存放位置。不知道是什么东西,可以先不用管它,一步步来也许就会明白了。

进到tomcat文件夹conf\Catalina\localhost这个文件夹内,建立一个solr.xml(其实名字是随便的,这里起的名字跟以后访问的项目名字一致,不过为了好找,还是跟部署的项目名一样吧),这里面的内容呢,其实很简单,就和下面类似:

 

<Context docBase="D:/server/apache-tomcat-6.0.32/webapps/apache-solr-1.4.1.war" reloadable="true">
	<Environment name="solr/home" type="java.lang.String" value="E:/framework/libPack/apache-solr-1.4.1/example/solr" override="true" />
</Context>

  这个Context相信大家都知道罗,它是指定了war包的位置,当启动tomcat后它会自动被部署到webapps目录下,这也是eclipse所集成tomcat用的部署方式。而reloadable="true"则表明可以重新加载,即当这个部署内容改变时,它会自动进行加载。

下面的solr/home是重点啦,type是固定的,先不管,value指定的就是它用的索引目录。override当然就是覆盖啦,如果存在则覆盖。

这个solr/home其实在solr的下载包中已经带有一个,我们可以找到solr目录下的example/solr这个目录,下面就是我们所说的solr/home,其实当中最重要的还是config目录下的solrconfig.xml,这个是solr的主要配置文件,可以在里面找到<dataDir>${solr.data.dir:./solr/data}</dataDir>这样一句,它指定了索引记录放置的位置,我们启动tomcat后它会在我们当前的目录下生成solr/data文件夹,里面就是索引文件。如果我们从tomcat的bin启动,那么它会在bin目录下生成solr/data文件夹,可以根据自己需要进行修改,只要把./solr/data改成想让它放在目录就可以了。

这样配置完成后,我们启动tomcat之后在浏览器输入http://localhost:8080/solr/admin就可以看到solr的管理界面啦。



 这样我们的配置就大功告成了。

曾经看过javaeye上一位朋友问过淘宝上的分面搜索是怎么实现的,当时有一位高人说是用solr,没想到它可以做出这么牛的东西,还有好多要学习呢。

  • 大小: 29.8 KB
  • 大小: 27.5 KB
分享到:
评论
1 楼 liuxuejin 2012-04-21  
很详细的教程阿!

相关推荐

    solr初体验

    Solr初体验:深入理解开源全文搜索引擎 Solr,全称Apache Solr,是一个高度可扩展的、开源的全文搜索引擎平台。它允许开发者通过HTTP接口对大量文本数据进行高效的搜索和分析。Solr由Java编写,是Apache软件基金会...

    Solr初体验

    Solr初体验 Apache Solr 是一款开源的全文搜索引擎,基于 Lucene 库,提供了高效、可扩展的搜索和分析功能。它不仅用于网站的全文检索,还广泛应用于企业级的文档检索、商品搜索以及数据挖掘等领域。这篇博客将带你...

    solr(solr-9.0.0.tgz)

    1. **bin** 文件夹:这个目录下有启动和管理Solr服务器的各种脚本,如`solr`命令行工具,可以用于启动、停止和管理Solr实例。 2. **server** 文件夹:这是Solr的核心所在,包括了Jetty服务器(默认的嵌入式HTTP...

    Apache Solr(solr-8.11.1.tgz)

    1. **Solr WAR 文件**:这是核心的搜索服务器应用程序,通常命名为`solr.war`。你可以将这个WAR文件部署到任何支持Java Servlet容器,如Tomcat或Jetty上运行。 2. **Server 目录**:包含运行Solr服务器所需的所有...

    solr-6.2.0源码

    1. 分布式搜索:Solr 6.2.0支持集群部署,可以将索引分片到多个节点,实现水平扩展,提升系统处理能力。 2. 实时搜索:Solr具有实时索引和查询的能力,一旦数据被更新,索引会立即反映出来,提供实时搜索体验。 3. ...

    solr4.7服务搭建

    1. **复制 solr.war 文件**:将 `D:\solr\solr-4.7.2\example\webapps` 下的 solr.war 文件复制到 `D:\solr\tomcat7\webapps` 目录。 2. **复制 Solr 配置文件**:将 `D:\solr\solr-5.2.0\server\solr` 下的所有文件...

    Apache Solr(solr-8.11.1.zip)

    1. **SolrCloud模式**:从版本8开始,Solr支持SolrCloud模式,这是一个分布式搜索和索引存储解决方案。它允许Solr集群进行自动故障转移和数据恢复,确保高可用性和容错性。 2. **集合与分片**:在SolrCloud中,数据...

    solr.war包solr.war包solr.war包solr.war包solr.war包

    solr.warsolr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包...

    solr服务器_solr_

    1. **索引**:索引是Solr处理数据的基础,它是对文档进行预处理后的结果,用于快速查询。Solr使用倒排索引技术,将文档中的每个词映射到包含该词的文档列表,大大提高了搜索速度。 2. **Core**:在Solr中,Core是一...

    solr-7.4.0.zip

    1. `bin`目录:包含Solr的启动脚本,如`solr`和`solr.cmd`,分别用于Linux/Unix和Windows系统启动Solr服务器。 2. `server`目录:包含了Solr服务器的核心组件,如Jetty web服务器,Solr配置文件,以及SolrCloud相关...

    solr(solr-9.0.0-src.tgz)源码

    1. **Solr架构** Solr的架构基于Lucene,一个强大的全文搜索引擎库。它提供了分布式、可扩展、高可用性的搜索服务。Solr通过RESTful API与客户端进行交互,支持XML、JSON、CSV等多种数据格式。 2. **核心组件** -...

    solr安装包下载地址

    Solr,全称为Apache Solr,是一款开源的企业级搜索平台,由Apache软件基金会开发并维护。它是基于Java的,能够处理大量数据并提供...通过深入学习和实践,你可以充分利用Solr的特性,为你的项目带来卓越的搜索体验。

    solr定时自动同步数据库需要用到的apache-solr-dataimportscheduler.jar包

    1. `apache-solr-dataimportscheduler.jar`: 这是核心的定时同步插件,需要添加到Solr服务器的类路径中。 2. 数据导入配置文件:这些文件(通常是XML格式)定义了Solr如何与MySQL数据库通信,包括连接参数、SQL查询...

    Linux上Solr的启动方式

    (1)借助X Shell上传solr的安装包到/usr/local/目录下,使用 tar -zxvf命令进行解压.  (2)使用内置的Jetty来启动Solr服务器只需要在example目录下,执行start.jar程序即可,我们可以直接执行命令:java –jar ...

    解决solr启动404问题

    Solr是Apache Lucene项目的一个子项目,是一个高性能、基于Java的企业级全文搜索引擎服务器。当你在尝试启动Solr时遇到404错误,这通常意味着Solr服务没有正确地启动或者配置文件设置不正确。404错误表示“未找到”...

    ikanalyzer-solr8.4.0_solr8_solr_ikanalyzer_中文分词_

    ikanalyzer 是一个专门为Java开发的中文...总之,ikanalyzer-solr8.4.0 是 Solr 8.4.0 版本下用于中文分词的重要工具,通过合理的配置和使用,可以显著提高 Solr 对中文文本的处理能力,从而提升搜索质量和用户体验。

    ikanalyzer-solr中文分词包兼容solr7.5

    在Solr中集成ikanalyzer,可以提高中文搜索的性能,使得搜索结果更加准确,用户体验得到提升。 在实际应用中,安装ikanalyzer-solr分词包的步骤大致如下: 1. 将`ik-analyzer-solr5-5.x.jar`添加到Solr服务器的`...

    solr的学习

    1. 在 Solr 解压包的 example\solr 文件夹下创建 SolrHome。 2. 复制 solr-4.10.3\example\solr 文件夹到本地的一个目录,并将文件名改为 solrhome。 3. 打开 SolrHome 目录。 4. SolrCore 创建成功。 - **配置...

    solr ik分词器

    1. **获取IK Analyzer**:首先,你需要下载ikanalyzer-solr5的压缩包,这个版本是专门为Solr 5.x设计的。确保你下载的版本与你的Solr实例匹配。 2. **解压并复制文件**:解压缩下载的文件,将其中的`ikanalyzer-*....

    solr-4.10.3

    1. **SolrCloud模式**:SolrCloud是Solr的一种分布式部署模式,引入了Zookeeper进行集群管理和配置协调。在Solr-4.10.3中,这一特性已经相当成熟,支持自动分片、故障转移和负载均衡,使得Solr可以处理大规模的数据...

Global site tag (gtag.js) - Google Analytics