`
Java_大猫
  • 浏览: 173884 次
  • 性别: Icon_minigender_1
  • 来自: 大连
社区版块
存档分类
最新评论

solr4.1 增量导入 & 删除索引

 
阅读更多
solr4.1学习的第二篇笔记。

废话不多说 贴代码。

打开 之前的 data-config。xml

<?xml version="1.0" encoding="UTF-8" ?>
<dataConfig>
<dataSource type="JdbcDataSource" driver="oracle.jdbc.driver.OracleDriver" url="jdbc:oracle:thin:@IP:1521:db01" user="root" password="root" />
<document>
<entity name="solrtest" pk="ID" query="select ID,USER_NAME,USER_PASS,USER_TYPE,USER_ROLE from T_USER"
	 deltaImportQuery="select ID,USER_NAME,USER_PASS,USER_TYPE,USER_ROLE from T_USER where ID = '${dataimporter.delta.ID}'"
	 deltaQuery="select ID from T_USER where UPDATE_TIME > to_date('${dataimporter.last_index_time}','yyyy-mm-dd hh24:mi:ss')">
	<field column="ID" name="id"/>
	<field column="USER_NAME" name="username"/>
	<field column="USER_PASS" name="userpass"/>
	<field column="USER_TYPE" name="usertype"/>
	<field column="USER_ROLE" name="userrole"/>
</entity>
  </document>
</dataConfig>


这里 增加了 deltaImportQuery  deltaQuery

这里的增量 用到了时间。。也就是说solr 会把数据库对应数据修改后,也要记录次数据的修改时间,他会根据时间对比去做增量,所以 表结构一定要有时间。

删除索引  其实有3种方法,



    curl http://localhost:8080/solr/update --data-binary "<delete><query>title:abc</query></delete>" -H 'Content-type:text/xml; charset=utf-8'  
      
    #删除完后,要提交  
      
    curl http://localhost:8080/solr/update --data-binary "<commit/>" -H 'Content-type:text/xml; charset=utf-8' 





    java -Ddata=args  -jar post.jar "<delete><id>42</id></delete>"  
      
    #怎么使用 post.jar 查看帮助  
      
    java -jar post.jar -help  



三 URL
http://localhost:9080/solr/update/?stream.body=%3Cdelete%3E%3Cid%3E14%3C/id%3E%3C/delete%3E&stream.contentType=text/xml;charset=utf-8&commit=true


四 就是通过设置一个表用来存放删除的数据ID,然后通过在 XML中配置
deletedpkquery 进行
分享到:
评论

相关推荐

    solr6 增量导入demo

    在Solr6中,增量导入(Incremental Indexing)是一项重要的功能,它允许系统仅更新自上次导入以来发生变化的数据,从而提高了数据处理的效率并降低了资源消耗。本教程将深入探讨Solr6的增量导入及其应用。 一、Solr...

    solr4.1+IK中文分词

    Solr4.1 + IK中文分词是针对Apache Solr搜索引擎的一个重要组合,它使得在中文环境下进行全文检索和分析变得更加高效和精确。Apache Solr是一个开源的企业级搜索平台,基于Lucene库,提供了高性能、可扩展的全文索引...

    solr增量导入更新索引包

    增量导入更新索引包是Solr中的一项重要功能,它允许系统仅处理自上次完整索引以来发生改变的数据,从而大大提升了效率并降低了资源消耗。下面将详细阐述Solr增量更新的相关知识点。 1. **Solr的索引机制** Solr...

    solr4.1安装配置

    在本文中,我们将深入探讨如何在Windows 7 64位环境下安装配置Solr 4.1,并结合IK分词器进行中文处理,以及使用SolrJ进行索引操作。 一、安装配置Solr 4.1 1. **安装JDK**: - 首先,下载并安装JDK 7的64位版本,...

    solr4.1 reference guide

    solr4.1参考指南是一份详细的手册,涵盖了Solr 4.1版本的所有功能和特性。这份参考手册帮助用户理解和掌握Solr的安装、配置、管理和使用等各个方面。以下是该参考手册中所包含的一些知识点: 安装Solr: 在Getting...

    Solr数据库插入(全量和增量)索引

    Solr 数据库插入全量和增量索引 Solr 是一个基于 Lucene 的搜索引擎,可以快速高效地对大量数据进行索引和查询。在实际应用中,我们需要将数据插入 Solr 索引库中,以便实现高效的搜索功能。本文将详细介绍 Solr ...

    跟益达学Solr5之增量索引MySQL数据库表数据

    在传统的全量索引中,Solr会一次性将所有数据库数据导入索引。然而,随着数据的不断增长,全量索引不仅耗时,而且可能对系统造成较大压力。增量索引则只对新插入、更新或删除的数据进行索引,显著提高了效率和性能。...

    solr定时增量更新索引所需jar包

    solr定时增量更新索引所需jar包包括:solr-dataimporthandler-4.0.0.jar、solr-dataimportscheduler.jar(6.x适用)、solr-dataimporthandler-extras-4.0.0.jar。

    Solr 4.1 helper-crx插件

    使用Solr管理页面时,此扩展允许保存和还原Solr 4.1服务器请求。 Solr管理员网页上有一个查询表单,可通过填写表单字段并提交表单来帮助构建复杂的查询。 使用此表单调试设计时,一次又一次地填写相同的字段很麻烦。...

    solr定时增量更新jar包1.4

    "solr定时增量更新jar包1.4"是专门为Solr设计的一个组件,它允许用户设置定时任务来自动检测和导入新的或者修改过的数据,从而保持索引与数据库或其他数据源的一致性。 这个组件主要依赖于`apache-solr-...

    solr 定时增量更新jar包

    增量更新的核心在于识别出自上次完整或增量导入以来发生改变的数据。在Solr中,DIH通常通过比较数据源的主键或时间戳来实现这一点。当检测到有新的记录或者已存在记录有更新时,DIH会将这些变更导入到Solr索引中,而...

    solr增量更新架包apache-solr-dataimportscheduler.jar

    2. **增量导入**:增量导入只导入自上次导入以来发生变化的数据。Solr通过跟踪数据源中的“lastModified”或者其他时间戳字段来识别新数据或已修改的数据。这样可以显著减少索引时间和资源使用。 "apache-solr-...

    java solr solrj 带账号密码增量查询添加索引

    主要讲解了 solr客户端如何调用带账号密码的solr服务器调用,实现添加索引和查询索引,以及分组查询

    solr7.4数据库导入Demo(mysql数据库)

    在Solr 7.4版本中,我们可以通过数据导入工具(DataImportHandler, DIH)来实现数据库中的数据导入,以便进行全文搜索和分析。本Demo将展示如何使用Solr 7.4与MySQL数据库集成,实现数据导入,并结合IK分词器提升...

    solr自动增量更新jar包

    solr自动增量更新jar包,适用于solr4的版本,希望对大家有帮助

    solr6定时增量更新

    solr6定时增量更新jar包

    solr4.9开发所需jar包

    在Solr4.9中,DIH可以帮助开发者轻松地将大量数据导入到Solr中进行搜索,这对于需要实时或定期更新索引的应用来说尤其重要。 在开发Solr4.9时,开发者需要了解以下关键知识点: 1. **Solr核心概念**:如集合...

    solr5.3.1 导入mysql数据

    4. **增量导入和 delta-import**: 如果数据源有实时更新,可以使用增量导入功能只导入自上次导入以来发生变化的记录,提高效率。 在实际应用中,我们还需要关注性能优化、安全性、集群部署等方面。例如,可以通过...

    apache solr1.3.0开发包源码及文档

    Apache Solr 1.3.0发布,Apache Solr是一个性能强大的,基于 Lucene 的全文搜索的 开源企业级搜索服务器,拥有XML/HTTP,JSON APIs,hit highlighting, ...新的DataImportHandler提供简易方式索引数据库内容进入Solr

Global site tag (gtag.js) - Google Analytics