`
javafw
  • 浏览: 13382 次
  • 性别: Icon_minigender_1
  • 来自: 成都
社区版块
存档分类
最新评论

使用solr为数据库构建全文检索引擎

    博客分类:
  • solr
阅读更多

安装 solr

 

1. 选择 solr(http://apache.etoak.com//lucene/solr/  )合适的版本 

   并解压缩到相应目录(例如D:\java\solr)。

2. 进入 solr/example 目录,这个目录下自带有 jetty, 所以可以直接控制台启动。

cd  D:\java\solr

java -jar startup.jar

3. 访问 http://localhost:8983/solr/admin/ ,如果网页正常显示,说明 solr 可以正常运行。

 

配置 solrconfig.xml (D:\java\solr\e xample \ solr \ conf \ 目录下 )

 

<requestHandler name="/dataimport"

class="org.apache.solr.handler.dataimport.DataImportHandler">

      <lst name="defaults">

            <str name="config">data-config.xml</str>

      </lst>

</requestHandler>

 

配置 data-config.xml

 

1. D:\java\solr\ example \ solr \ conf \ 目录下创建一个 xml 文件,并命名为 data-config.xml

2. 在该文件中,进行数据的相关配置

例如:

<dataConfig>


<dataSource type=”JdbcDataSource”

driver="com.microsoft.jdbc.sqlserver.SQLServerDriver"

url="jdbc:microsoft:sqlserver://localhost:1433;databaseName=ExtDB"

user="sa"

password=”” />


      <document name="doc">         

 <entity name="book" query="select * from t_book">

                   <field column="bookId" name="id" />

                   <field column="bookName" name="name" />

                   <field column="bookAuthor" name="author" />

                   <field column="bookAmount" name="amount" />

                   <field column="bookPrice" name="price" />

                   <field column="bookMemo" name="memo" />

             </entity>

</document>


</dataConfig>

 

配置 schema.xml ( D:\java\solr\ example \ solr \ conf \ 目录下 )


<fields>

    <field name="id" type="string" indexed="true" stored="true" required="true" />

    <field name="name" type="text" indexed="true" stored="true" />

    <field name="author" type="textgen" indexed="true" stored="true" />

    <field name="amount" type="int" indexed="false" stored="true" />

    <field name="price" type="float" indexed="false" stored="true" />

     <field name="memo" type="text" indexed="false" stored="true" />

     <field name="text" type="text" indexed="true" stored="false" multiValued="true"/>

    <dynamicField name="*" type="ignored" multiValued="true" />  

  </fields>

 

<uniqueKey>id</uniqueKey>

 

<defaultSearchField>text</defaultSearchField>

 

<solrQueryParser defaultOperator="OR"/>

 

<copyField source="name" dest="text"/>

<copyField source="author" dest="text"/>

 

 

执行全量或增量索引

 

如果都按照上述步骤配置完毕,并能正确启动 , 你可以通过浏览器执行如下命令来开始全量索引 http://localhost:8983/solr/dataimport?command=full-import

你可以通过这个地址 http:// localhost:8983/solr/dataimport 检查执行的状态

 

如果一切正常,你就可以通过 http:// localhost:8983/solr/admin/ 进行查询,你会得到一个 xml 格式的返回。

 

如果要使用增量索引,使用这个命令

http:// localhost:8983/solr/dataimport?command=delta-import


本文参考自: http://blog.csdn.net/love_tu/archive/2010/09/03/5861942.aspx

官方详细说明 : http://wiki.apache.org/solr/DataImportHandler

 

对原文作者表所感谢!


分享到:
评论

相关推荐

    solr同步数据库需要jar包

    Solr,全称为Apache Solr,是一款开源的企业级搜索平台,基于Java开发,广泛应用于全文检索、企业级内容管理和网站搜索。在Solr中,为了实现与数据库的实时同步,通常会采用增量索引策略,确保数据库中的新数据或...

    PHP 全文检索引擎 Sphinx 介绍

    Sphinx是一个高性能、开源的全文检索引擎,专为配合SQL数据库而设计,如MySQL和PostgreSQL,用于实现高效且专业的全文搜索功能。它的核心优势在于能够提供比数据库原生搜索更强大的搜索性能,并且易于集成到各种使用...

    人工智能-项目实践-搜索引擎-对百度百科进行爬取,通过solr搜索引擎实现全文检索

    通过这个项目,不仅可以掌握爬虫技术、数据预处理以及全文检索的基本原理和操作,还可以深入了解Solr的使用,为未来在大数据检索、信息管理等领域的工作打下坚实的基础。同时,这样的实践也有助于培养解决问题和独立...

    solr+IK分词集成tomcat实现全文检索

    Solr+IK分词集成Tomcat实现全文检索是构建高效搜索引擎的关键步骤,尤其在电子商务等大量数据检索场景中,这一技术的应用尤为重要。本教程将详细阐述如何通过Solr结合IK分词器,在Tomcat服务器上搭建一个功能完备的...

    基于Solr的企业级信息检索的设计与实现

    Solr是Apache基金会下的一个开源项目,它基于Lucene全文检索工具包,提供了更为高级且可定制的企业级搜索解决方案。Solr用Java语言编写,能够支持分布式搜索和索引,具备高度的灵活性和可扩展性,适用于处理大量结构...

    Lucene全文检索框架+Solr搜索引擎(2018版.Java)

    在实际项目中,Lucene和Solr常常结合使用,实现高效的全文检索服务。例如: 1. **信息检索系统**:构建企业内部的知识库或文档检索系统,帮助员工快速查找所需资料。 2. **电子商务**:在商品搜索中,利用Solr实现...

    使用lucenesolr搭建Oracle数据库全文搜索服务.docx

    ### 使用Lucene Solr搭建Oracle数据库全文搜索服务 #### 一、基础知识介绍 - **Lucene**: 是一个高性能、全功能的全文检索引擎库。它为开发者提供了构建搜索应用程序所需的工具,但不提供完整的搜索应用。 - **...

    Solr文档.pdf

    传统的数据库查询方式往往难以满足这些需求,而使用Solr等全文检索技术则可以较好地实现这些功能。尽管单独使用Lucene实现站内搜索在索引维护、索引性能优化和搜索性能优化方面需要较大的开发工作量,而通过第三方...

    solr全文检索+IK分词器

    Solr全文检索与IK分词器的整合是构建高效中文搜索引擎的关键步骤。Solr,作为Apache Lucene的一个开源搜索服务器,提供了强大的全文检索、高级索引和搜索功能。而IK分词器(Intelligent Chinese Analyzer for Solr)...

    solr搜索引擎的使用介绍

    Solr,全称为Apache Solr,是Apache软件基金会的一个开源项目,基于Java开发,是一款高效、灵活且强大的全文检索服务引擎。它构建在Lucene库之上,提供了更高级别的企业级搜索功能,如分布式搜索、缓存、命中高亮、...

    solr实现的搜索引擎

    数据导入到Solr通常有两种方式:使用Solr DataImportHandler (DIH)从关系数据库导入,或使用SolrJ Java客户端API直接推送JSON、XML等格式的数据。在`webapp`目录下的示例可能展示了如何配置DIH来连接数据库并建立...

    全文搜索技术solr Demo

    全文搜索技术是现代互联网应用中不可或缺的一部分,它使得用户能够快速、准确地在大量数据中找到所需信息。...通过这个Demo,你将能够快速上手Solr,为你的项目构建高效、可扩展的全文搜索解决方案。

    SSM+spring-data-solr+solr7.7 全文搜索代码

    SSM(Spring、SpringMVC、MyBatis)框架与Solr的集成是Java开发中实现全文搜索引擎功能的常见方式。本项目结合Spring Data Solr和Solr 7.7,提供了一种高效的搜索解决方案。下面将详细讲解相关知识点。 1. **Spring...

    solr定时自动同步数据库需要用到的apache-solr-dataimportscheduler.jar包

    Apache Solr是一款强大的开源搜索引擎,它能够高效地处理和索引大量数据,提供快速的全文检索、 faceting、高亮显示等高级功能。在实际应用中,为了保持搜索结果的实时性,我们往往需要将数据库中的数据实时或定时...

    利用Solr搭建你的搜索引擎

    标题中的“利用Solr搭建你的搜索引擎”意味着我们将探讨Apache Solr这一开源全文搜索平台的搭建过程。Solr是基于Lucene库的,提供了一个高效、可扩展的搜索和导航功能,广泛应用于各种企业的数据检索需求。 Solr的...

    人工智能-项目实践-搜索引擎-solr构建景点搜索引擎

    在本项目实践中,我们将深入探讨如何使用开源搜索平台Solr构建一个针对景点的搜索引擎,以实现高效、精准的信息检索。Solr是Apache Lucene项目的一部分,它提供了强大的文本分析、索引和搜索功能,适用于各种大数据...

    lucence全文检索引擎

    通过提供的“lucence”压缩包,你可以深入学习Lucene的开发文档,观看视频教程,并使用提供的开发jar包进行实践操作,逐步掌握这个强大的全文检索引擎。在实际项目中,结合具体的业务需求,灵活运用Lucene的各项功能...

    Solr全文索引

    Solr全文索引是基于Apache Lucene的开源搜索服务器,它提供了一个分布式、可扩展、高性能的全文检索和分析平台。在本项目中,"Weiz.Solr"似乎是一个C#开发的Solr客户端库,用于简化与Solr服务器的交互。下面将详细...

Global site tag (gtag.js) - Google Analytics