`
LiYunpeng
  • 浏览: 958080 次
  • 性别: Icon_minigender_1
  • 来自: 大连
社区版块
存档分类
最新评论

solr5.0入门及一些遇到的问题总结

    博客分类:
  • solr
阅读更多
sol可通过对文档数据简历索引,然后进行搜索的搜索引擎工具,我们常用的json/xml/各种文档文件,或者数据库都可以被看作是文档。

首先,要了解SOLR有一个控制台,可以帮我们做很多事~

solr的安装网上有一大堆就不说了 但是需要注意的是,貌似solr的每个版本目录结构都不一样,看到网上好多文章描述的步骤,对应的文件夹和文件都不存在了 我的目录结构如下



其中bin不多说了,solr的核心运行文件./solr start/stop/restart等等命令吧
solr控制台
http://localhost:8983/solr
1.创建core
这里面,控制台里是菜单上有一个core,点进去之后有一个Add Core 这里注意,至少我试了在这里是创建无效的,他会去找Solr根目录下你创建这个core名称文件夹里面的配置文件~ 所以,应该是先通过命令创建core,然后在这个菜单下添加到控制台 命令 到solr的bin目录下,./solr create -c [core_name]这里面的core_name就是你要创建的core的名字,比如 ./solr create -c test
文件会被创建在server/solr的目录下,然后里面会有一些预生成的文件。

2.schema.xml
在创建的文件夹中的conf文件夹下
这里面给我带来很多困扰,默认生成的一个managed-schema文件,网上很多资料写着,需要将这个文件改名为schema.xml,然后修改当中的配置
但是需要注意的一点就是,需要将原来的这个文件删掉,因为在solrconfig.xml里面有一段注释如下:
<!-- To disable dynamic schema REST APIs, use the following for <schemaFactory>:
  
       <schemaFactory class="ClassicIndexSchemaFactory"/>

       When ManagedIndexSchemaFactory is specified instead, Solr will load the schema from
       the resource named in 'managedSchemaResourceName', rather than from schema.xml.
       Note that the managed schema resource CANNOT be named schema.xml.  If the managed
       schema does not exist, Solr will create it after reading schema.xml, then rename
       'schema.xml' to 'schema.xml.bak'. 
       
       Do NOT hand edit the managed schema - external modifications will be ignored and
       overwritten as a result of schema modification REST API calls.

       When ManagedIndexSchemaFactory is specified with mutable = true, schema
       modification REST API calls will be allowed; otherwise, error responses will be
       sent back for these requests. 
  -->

所以,如果不删除这个文件,就会默认取读取managed-schema,无论你怎么修改schema.xml都不起作用,当然,可以在这段注释代码下修改引用的文件

再说schema.xml里面配置的就是对应的数据了,配置对应的字段(名称、类型、是否设置索引、是否保存、是否可以为多个值等等)
相关的配置推荐大家到http://www.solrcn.com/books/#2-en去看
或者去看solr的官方文档

3.solrconfig.xml
在创建的文件夹中的conf文件夹下
这个文件是配置当前core的,我是通过从mysql导入数据,在这个文件里面添加了如下代码,注意位置哦,生成的文件里,本来就存在一些<requestHandler>标签
<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">   
            <lst name="defaults">   
                 <str name="config">data-config.xml</str>   
            </lst>   
  </requestHandler>

这里面的data-config.xml需要在同级目录下
data-config.xml如下
<dataConfig>
    <dataSource type="JdbcDataSource"
    driver="com.mysql.jdbc.Driver"
    url="jdbc:mysql://127.0.0.1:3306/brander"
    user="root"
    password="root"/>
    <document>
        <entity name="brand_share" 
            query="select id, text from t_test">
            <field column="id" name="id" />
            <field column="text" name="text" />
        </entity>
    </document>
</dataConfig>

这个文件是配置JDBC以及对应的SQL,查询出来的数据将作为solr的Doc文档存在,solr则通过Doc文档建立索引并进行检索
column对应数据库字段,name对应schema里面的字段名
还有就是对于jar包,连接数据库的jar包和dataimporthandle的jar包
solr-dataimporthandle.jar存放在solr解压目录下的dist里面,这里面存了很多以后可能会需要用到的solr功能,将这个包copy到server下的solr-webapp/webapp/WEB-INF/lib下,也就是我们运行的控制台的Web应用程序中
jdbc的连接jar包,则放到server下的lib(这是在网上看到的,但是放进去看日志也说找不到)所以如果找不到,需要在solrconfig.xml里面配置lib文件夹的位置,类似如下
<lib dir="" />


4.elevate.xml
这个文件我看很多博客都没有写,但是我在配置的时候,就会报错,后来查看日志,说需要修改这个文件
将里面的doc标签都加上注释
这个文件是实现类似百度竞价排名一样的功能


以上基本工作就完成了,在控制台添加core后,可以在core选择器里选择刚刚创建的core
然后进行数据导入、查询等等一系列的操作
可在schema browser里面查看自己配置的schema和相关的存储关系

可以通过控制台的core里进行对配置修改后的reload
可以通过core页面内的dateimport对配置data-config.xml的配置修改进行reload

有一点很重要就是要学会看log,否则,功能不好用找不到头绪,也不知道到底哪里出错了
配置的时候遇到相关的问题,就可以通过日志分析然后再Google了,这样入门才会快一些
  • 大小: 56.2 KB
分享到:
评论

相关推荐

    solr_5.0_tomcat7_IKAnalyzer中文分词安装及demo

    在这个"solr_5.0_tomcat7_IKAnalyzer中文分词安装及demo"的压缩包中,你将找到如何在Solr 5.0中集成IKAnalyzer并进行演示的详细步骤。 首先,我们需要了解Solr与IKAnalyzer的集成过程: 1. **下载和解压**:获取...

    solr 5.0搭建 和使用 ik分词

    Solr 5.0是Apache Lucene项目的一个子项目,是一个高性能、全文检索服务器,用于构建企业级的搜索应用。本篇文章将详细讲解如何搭建Solr 5.0,并使用IK分词器进行中文分词处理,提升搜索效果。 首先,我们需要下载...

    tomcart 部署 solr5.0的部署方法

    通过以上步骤,我们可以在Tomcat环境下成功部署Solr5.0,并实现数据库连接及基本的安全配置。需要注意的是,在实际应用中可能还需要根据具体需求进一步调整配置参数,例如增加安全性设置、优化性能等。此外,对于...

    IK分词solr5.0.0

    6. **监控与维护**:在实际应用中,为了保持分词效果的准确性和实时性,可能需要定期更新IK分词器的词典,尤其是当遇到新的词汇或特定领域词汇时。 在Solr 5.0.0中使用IK分词器,可以显著提高中文文本的检索效果,...

    ikanalyzer-for-solr5.0

    Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口。用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以通过Http Get操作提出查找请求,并得到XML格式的...

    solr5.0.0 ik5.0分词器,增量jar包,数据库链接包等

    solr5.0.0 所需jar包,包含solr-dataimportscheduler-1.0,solr-dataimporthandler-5.0.0,solr-dataimporthandler-extras-5.0.0,solr-analyzer-extra-5.1.0,IKAnalyzer-5.0,mysql-connector-java-5.1.35

    solr入门java工程

    在这个"solr入门java工程"中,我们将探讨如何使用Java客户端与华为FusionInsight SolrTest进行交互,以及如何在SolrCloud模式下进行分布式搜索。 首先,让我们了解Solr的基本概念。Solr的核心功能是提供高效的全文...

    solr学习入门教程

    ### Solr学习入门教程知识点详解 #### 一、Solr概览 Solr是一个开源的企业级搜索服务器,采用Java作为底层开发语言,具备高度的可扩展性和灵活性。它通过标准的HTTP协议和XML格式进行通信,这意味着即使不精通Java...

    Solr入门教程-solr学习入门经典教程

    solr学习入门经典教程,赶紧学习吧,从solr的搭建讲起,中文分词器的配置

    IKAnalyzer2012FF_x.jar 适用于Solr 4.9以上5.0以下版本

    IKAnalyzer2012FF_x.jar 适用于Solr 4.9以上5.0以下版本 集合solr使用修改IKAnalyzerSolrFactory.java 以适合4.9以前版本报错问题 适用场景 Solr 4.9.x/4.10.x + IKAnalyzer JDK7+ ...Solr5.0版本不适用

    详解java整合solr5.0之solrj的使用

    Java整合Solr5.0的过程中,SolrJ是Java客户端库,用于与Solr服务器进行交互,提供了方便的API来执行各种操作。本篇文章将详细阐述如何使用SolrJ进行索引管理和查询。 首先,集成SolrJ需要将相应的依赖库引入项目。...

    solr4.4.0入门配置步骤

    通常solr的安装包会包含example目录,该目录有Solr的示例应用和一些配置文件。对于Solr4.4.0版本,下载地址为***,用户可以在此地址获取到Solr4.4.0的安装文件。 第二步,准备一个Tomcat服务器。Tomcat是一个免费的...

    Solr入门使用详解.zip

    通过阅读“Solr使用详解.pdf”,你可以深入了解Solr的使用方法,掌握从安装配置到实际操作的全过程,从而更好地利用Solr解决实际的搜索和分析问题。同时,solrJ和IK分词器的使用将进一步提升你在Java环境中操作Solr...

    solr_开发入门例子

    本文将基于"solr_开发入门例子"这一主题,详细解释Solr的基础知识,包括其核心概念、安装配置、索引创建与查询,以及相关的开发工具。 1. **Solr核心概念** - **索引**: Solr通过建立倒排索引来实现快速全文检索。...

    IKAnalyzer-5.0.jar及solr-analyzer-extra-5.3.jar

    标题中的"IKAnalyzer-5.0.jar"和"solr-analyzer-extra-5.3.jar"是两个在中文搜索引擎系统Solr中常见的组件,主要用于处理中文分词问题。这两个组件在构建高性能的中文搜索解决方案中扮演着至关重要的角色。 首先,...

    Solr配置入门教程

    Solr配置入门教程主要涉及如何将数据从MySQL数据库和XML文件导入到Solr索引中。以下是详细步骤和相关知识点: 1. **下载与解压Solr**:首先需要从官方源获取Apache Solr的最新版本,并将其解压缩到一个合适的文件夹...

    solr7.4.0入门讲解,实时增量同步等

    solr入门环境搭建,sorl ik分词器分词,solr数据库数据导入,solr同步等技术实现及配置.版本solr7.4.0 + ikanalyzer-solr5 + solr-dataimport-scheduler

    solr-6.5.0第一部分

    总共286M,因级别不够只能一次上传80M所以拆分成多个,见谅

    solr入门教程

    Solr 是一个开源的全文搜索引擎,它提供了高效、可扩展的搜索和分析功能。本教程将引导你完成Solr的基本安装、配置以及数据库索引的建立,特别关注定时增量索引这一重要特性。 首先,从Apache官方网站下载Solr的...

Global site tag (gtag.js) - Google Analytics