spring batch默认的MultiResourceItemReader存在一个严重的bug,应用启动后往读取文件的目录添加文件是无法被读取的,以下代码修复了这个bug
package com.ternnetwork.batch.item.file; import java.io.IOException; import java.util.Arrays; import java.util.Comparator; import org.apache.commons.logging.Log; import org.apache.commons.logging.LogFactory; import org.springframework.batch.item.ExecutionContext; import org.springframework.batch.item.ItemStream; import org.springframework.batch.item.ItemStreamException; import org.springframework.batch.item.ParseException; import org.springframework.batch.item.ResourceAware; import org.springframework.batch.item.UnexpectedInputException; import org.springframework.batch.item.file.ResourceAwareItemReaderItemStream; import org.springframework.batch.item.support.AbstractItemStreamItemReader; import org.springframework.core.io.Resource; import org.springframework.core.io.support.PathMatchingResourcePatternResolver; import org.springframework.util.Assert; import org.springframework.util.ClassUtils; /** * Reads items from multiple resources sequentially - resource list is given by {@link #setResources(Resource[])}, the * actual reading is delegated to {@link #setDelegate(ResourceAwareItemReaderItemStream)}. * * Input resources are ordered using {@link #setComparator(Comparator)} to make sure resource ordering is preserved * between job runs in restart scenario. * * 该类扩展了原来的功能,实现动态获取资源文件列表 * 之前的resources无法监控到文件的增减,此类修复了这个bug * * @author Robert Kasanicky * @author Lucas Ward */ public class ExtendedMultiResourceItemReader<T> extends AbstractItemStreamItemReader<T> { private static final Log logger = LogFactory.getLog(ExtendedMultiResourceItemReader.class); private static final String RESOURCE_KEY = "resourceIndex"; private ResourceAwareItemReaderItemStream<? extends T> delegate; private Resource[] resources; private boolean saveState = true; private int currentResource = -1; // signals there are no resources to read -> just return null on first read private boolean noInput; private boolean strict = false; private String resourcesLocationPattern;//资源路径通配符 /** * In strict mode the reader will throw an exception on * {@link #open(org.springframework.batch.item.ExecutionContext)} if there are no resources to read. * @param strict false by default */ public void setStrict(boolean strict) { this.strict = strict; } private Comparator<Resource> comparator = new Comparator<Resource>() { /** * Compares resource filenames. */ public int compare(Resource r1, Resource r2) { return r1.getFilename().compareTo(r2.getFilename()); } }; public ExtendedMultiResourceItemReader() { this.setExecutionContextName(ClassUtils.getShortName(ExtendedMultiResourceItemReader.class)); } /** * Reads the next item, jumping to next resource if necessary. */ public T read() throws Exception, UnexpectedInputException, ParseException { if (noInput) { return null; } // If there is no resource, then this is the first item, set the current // resource to 0 and open the first delegate. if (currentResource == -1) { currentResource = 0; delegate.setResource(resources[currentResource]); delegate.open(new ExecutionContext()); } return readNextItem(); } /** * Use the delegate to read the next item, jump to next resource if current one is exhausted. Items are appended to * the buffer. * * @return next item from input */ private T readNextItem() throws Exception { T item = readFromDelegate(); while (item == null) { currentResource++; if (currentResource >= resources.length) { return null; } delegate.close(); delegate.setResource(resources[currentResource]); delegate.open(new ExecutionContext()); item = readFromDelegate(); } return item; } private T readFromDelegate() throws Exception { T item = delegate.read(); if(item instanceof ResourceAware){ ((ResourceAware) item).setResource(getCurrentResource()); } return item; } /** * Close the {@link #setDelegate(ResourceAwareItemReaderItemStream)} reader and reset instance variable values. */ public void close() throws ItemStreamException { super.close(); if(!this.noInput) { delegate.close(); } noInput = false; } /** * Figure out which resource to start with in case of restart, open the delegate and restore delegate's position in * the resource. */ public void open(ExecutionContext executionContext) throws ItemStreamException { super.open(executionContext); Assert.notNull(resourcesLocationPattern, "resourcesLocationPattern must be set"); PathMatchingResourcePatternResolver patternResolver=new PathMatchingResourcePatternResolver(); try { resources=patternResolver.getResources(resourcesLocationPattern);//动态读取资源列表 } catch (IOException e) { e.printStackTrace(); } noInput = false; if (resources.length == 0) { if (strict) { throw new IllegalStateException( "No resources to read. Set strict=false if this is not an error condition."); } else { logger.warn("No resources to read. Set strict=true if this should be an error condition."); noInput = true; return; } } Arrays.sort(resources, comparator); if (executionContext.containsKey(getExecutionContextKey(RESOURCE_KEY))) { currentResource = executionContext.getInt(getExecutionContextKey(RESOURCE_KEY)); // context could have been saved before reading anything if (currentResource == -1) { currentResource = 0; } delegate.setResource(resources[currentResource]); delegate.open(executionContext); } else { currentResource = -1; } } /** * Store the current resource index and position in the resource. */ public void update(ExecutionContext executionContext) throws ItemStreamException { super.update(executionContext); if (saveState) { executionContext.putInt(getExecutionContextKey(RESOURCE_KEY), currentResource); delegate.update(executionContext); } } /** * @param delegate reads items from single {@link Resource}. */ public void setDelegate(ResourceAwareItemReaderItemStream<? extends T> delegate) { this.delegate = delegate; } /** * Set the boolean indicating whether or not state should be saved in the provided {@link ExecutionContext} during * the {@link ItemStream} call to update. * * @param saveState */ public void setSaveState(boolean saveState) { this.saveState = saveState; } /** * @param comparator used to order the injected resources, by default compares {@link Resource#getFilename()} * values. */ public void setComparator(Comparator<Resource> comparator) { this.comparator = comparator; } /** * @param resources input resources */ public void setResources(Resource[] resources) { Assert.notNull(resources, "The resources must not be null"); this.resources = Arrays.asList(resources).toArray(new Resource[resources.length]); } public Resource getCurrentResource() { if (currentResource >= resources.length || currentResource < 0) { return null; } return resources[currentResource]; } public String getResourcesLocationPattern() { return resourcesLocationPattern; } public void setResourcesLocationPattern(String resourcesLocationPattern) { this.resourcesLocationPattern = resourcesLocationPattern; } }
关键代码
resources=patternResolver.getResources(resourcesLocationPattern);//动态读取资源列表
配置示例
<bean id="bpMultiResourceReader" scope="prototype" class="com.ternnetwork.batch.item.file.ExtendedMultiResourceItemReader"> <property name="resourcesLocationPattern" value="file:${batch.input.dir}*.csv"/> <property name="delegate" ref="bpFlatFileItemReader"/> </bean>
如果您觉得我的文章给了您帮助,请为我买一杯饮料吧!我将非常感激并坚持为大家提供更多帮助!
相关推荐
在本教程中,我们将探讨如何使用 Spring Batch 读取文本(txt)文件,并将读取到的数据处理后写入数据库。 首先,我们需要创建一个 Maven 项目,并在 `pom.xml` 文件中添加必要的依赖。这些依赖包括 `spring-boot-...
在 `springBatchDemo` 文件中,通常包含了示例代码,演示如何配置和运行一个简单的Spring Batch作业,涉及到读取数据库中的数据,进行处理,然后写回到数据库。你可以参考这些代码,理解Spring Batch的工作原理和...
在这个提供的压缩包文件中,名为"batch"的文件可能包含了一个简单的Spring Boot和Spring Batch整合的示例项目。这些文件可能包括Java源代码、配置文件以及可能的测试用例。通过查看这些文件,你可以学习如何将批处理...
Spring Batch提供了多种内置的ItemReader和ItemWriter实现,支持从数据库、文件等多种数据源读取数据,以及将数据写入到数据库、文件等目的地。 知识点五:数据处理 在数据被读取之后,通常需要经过一定的处理才能...
Spring Batch是一个轻量级的,完全面向Spring的批处理框架,可以应用于企业级大量的数据处理系统。Spring Batch以POJO和大家熟知的Spring框架为基础,使开发者更容易的访问和利用企业级服务。Spring Batch可以提供...
在本文中,我们将深入探讨如何使用 Spring Batch 实现读取多个文件并将数据导入数据库的示例。 首先,让我们了解项目的基本目录结构。在执行 Spring Batch 任务时,通常会有一个包含配置文件、实体类、处理器、读取...
Spring Batch可以通过配置文件或编程方式定义批处理作业的步骤和流程。 动态集群是指能够在运行时动态添加或移除服务器节点的集群环境。在Quartz中实现动态集群,主要是通过共享JobStore实现的,例如使用...
Spring Batch是一个开源的轻量级批处理框架,它提供了一整套可复用的...同时,对于提供IT类书籍pdf下载的内容,虽然与Spring Batch框架无直接关联,但IT类书籍的阅读也能够加深对Spring Batch框架的理解和应用能力。
**Spring Batch 深度解析** Spring Batch 是一个强大的、全面的批处理框架,由 Spring 社区开发,旨在简化企业级应用中的批量数据处理任务。这个框架提供了一种标准的方式来处理大量的数据输入和输出,使得开发者...
- **领域模型**:Spring Batch定义了一系列核心领域概念,如Job(作业)、Step(步骤)、Chunk(块)、Reader(读取器)、Processor(处理器)和Writer(写入器),这些概念构成了处理数据流的基本单元。 - **应用...
这个“springBoot+springBatch批量处理数据demo”涵盖了SpringBoot集成SpringBatch的基础流程,演示了如何构建一个批处理任务,从数据源读取,进行处理,然后写入结果。对于大型数据集的处理,这样的组合提供了强大...
在Spring Batch中,分区处理是一种优化策略,它将大型工作负载分解成多个较小、独立的任务,这些任务可以在不同的线程或甚至不同的节点上并行运行,从而提高处理速度。在本示例中,我们将深入探讨"spring-batch 分区...
Spring Batch提供了强大的读取器和写入器实现,这些实现支持多种数据源和格式,包括关系型数据库、文件系统和消息队列等。读取器通过ItemReader接口读取数据项,写入器通过ItemWriter接口将处理后的数据写入目标系统...
在压缩包文件 `spring-batch-4.0.0.M5` 中,包含了 Spring Batch 4.0.0 版本的预发布版本。这个版本可能包含了一些实验性的特性和改进,用于测试和反馈,以便在正式版中进行完善。 总的来说,Spring Batch 4.0.0 为...
Work with all aspects of batch processing in a modern Java environment using a selection of Spring frameworks. This book provides up-to-date examples using the latest configuration techniques based on...
Spring Batch API(Spring Batch 开发文档).CHM。 官网 Spring Batch API,Spring Batch 开发文档
Spring Batch提供了多种ItemReaders和ItemWriters来处理不同类型的数据源,如纯文本文件、XML文件和数据库。此外,还支持对ItemReaders进行分页以及对ItemWriters的配置,以及对数据库操作的特定支持。 扩展与并行...
SpringBatch 是一个强大的Java批处理框架,由Spring社区开发并维护,主要用于处理大量数据的后台操作,如批量导入导出、日志分析、定时任务等。在本文中,我们将深入探讨SpringBatch的学习入门,以及如何在IDEA环境...
Spring Batch 是一个强大的Java框架,专门用于处理批量数据处理任务。在给定的"Spring Batch 示例程序"中,我们可以深入探讨这个框架的核心概念和在实际应用中的使用方式。该示例程序采用的是Spring 3作为基础框架,...
mybatis、springBatch、mysql、quartz、spring、springMVC 部署说明: 本项目为两个数据库,由一个数据库的表向另外一个数据库的表做数据迁移,其中数据库脚本在:/src/main/resources/sql/下面(其中data_rep中的表...