`
234390216
  • 浏览: 10233642 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
博客专栏
A5ee55b9-a463-3d09-9c78-0c0cf33198cd
Oracle基础
浏览量:462667
Ad26f909-6440-35a9-b4e9-9aea825bd38e
springMVC介绍
浏览量:1775570
Ce363057-ae4d-3ee1-bb46-e7b51a722a4b
Mybatis简介
浏览量:1398400
Bdeb91ad-cf8a-3fe9-942a-3710073b4000
Spring整合JMS
浏览量:395030
5cbbde67-7cd5-313c-95c2-4185389601e7
Ehcache简介
浏览量:680003
Cc1c0708-ccc2-3d20-ba47-d40e04440682
Cas简介
浏览量:530911
51592fc3-854c-34f4-9eff-cb82d993ab3a
Spring Securi...
浏览量:1184069
23e1c30e-ef8c-3702-aa3c-e83277ffca91
Spring基础知识
浏览量:468001
4af1c81c-eb9d-365f-b759-07685a32156e
Spring Aop介绍
浏览量:151408
2f926891-9e7a-3ce2-a074-3acb2aaf2584
JAXB简介
浏览量:68173
社区版块
存档分类
最新评论

基于大量数据的Excel文件生成方案

    博客分类:
  • poi
阅读更多

基于大量数据的Excel生成方案

以往我们在基于POI生成Excel文件时,都是利用官方提供的HSSF或XSSF对应的系列API,它们操作简便,上手比较快。但是对于大数据量的Excel文件生成往往会比较耗时,这是我们利用标准的API进行开发的一个痛点。对于性能更高一点的API,POI官方会建议我们使用SXSSF系列API,虽然它的性能比起HSSF和XSSF会有很大的提高,但是面对大量数据的时候还是会比较慢,为此官方还给我们提供了一种基于XML的方案。

其实对于一个Excel文件来说,最核心的是它的数据。Excel文件中的数据和样式文件是分开存储的,它们都对应于它自己体系中的一个XML文件。有兴趣的朋友可以把Excel文件的后缀名改成“.zip”,然后用压缩文件把它解压缩,可以看到它里面的结构是由一堆的XML文件组成的。如果我们把解压缩后的文件再压缩成一个压缩文件,并把它的后缀名改为Excel文件对应的后缀名“.xlsx”或“.xls”,然后再用Excel程序把它打开。这个时候你会发现它也是可以打开的。笔者本文所要讲述的基于大量的数据生成Excel的方案就是基于这种XML文件的方案,它依赖于一个现有的Excel文件(这个Excel文件可以在运行时生成好),然后把我们的数据生成对应的XML表示,再把我们的XML替换原来的XML文件,再进行打包后就变成了一个Excel文件了。基于这种方式,笔者做了一个测试,生成了一个拥有3500万行,5列的Excel文件,该文件大小为1GB,耗时412秒。这种效率比起我们应用传统的API来说是指数倍的。

细节的实现详情,请读者自己参考以下示例代码,该示例代码是笔者从Apache官方下载的,原地址是https://svn.apache.org/repos/asf/poi/trunk/src/examples/src/org/apache/poi/xssf/usermodel/examples/BigGridDemo.java。需要注意的是生成的XML中需要应用到的样式需要事先生成,需要应用函数、合并单元格等逻辑的时候,可以先拿一个Excel文件应用对应的函数、合并逻辑,再把它解压缩后查看里面的XML文件的展现形式,然后自己拼接的时候也拼接成对应的形式,这样自己生成的Excel文件也会有对应的效果。

public class BigDataTest {

    private static final String XML_ENCODING = "UTF-8";
    
    public static void main(String[] args) throws Exception {

    	long start = System.currentTimeMillis();
    	
        // Step 1. Create a template file. Setup sheets and workbook-level objects such as
        // cell styles, number formats, etc.

        XSSFWorkbook wb = new XSSFWorkbook();
        XSSFSheet sheet = wb.createSheet("Big Grid");

        Map<String, XSSFCellStyle> styles = createStyles(wb);
        //name of the zip entry holding sheet data, e.g. /xl/worksheets/sheet1.xml
        String sheetRef = sheet.getPackagePart().getPartName().getName();

        //save the template
        FileOutputStream os = new FileOutputStream("template.xlsx");
        wb.write(os);
        os.close();

        //Step 2. Generate XML file.
        File tmp = File.createTempFile("sheet", ".xml");
        Writer fw = new OutputStreamWriter(new FileOutputStream(tmp), XML_ENCODING);
        generate(fw, styles);
        fw.close();

        //Step 3. Substitute the template entry with the generated data
        FileOutputStream out = new FileOutputStream("D:/big-grid2.xlsx");
        //用心拼接生成的XML文件替换原来模板Excel文件中对应的XML文件,再压缩打包为一个Excel文件。
        substitute(new File("template.xlsx"), tmp, sheetRef.substring(1), out);
        out.close();
        
        wb.close();
        
        long end = System.currentTimeMillis();
        
        System.out.println("耗时: " + (end - start));
    }

    /**
     * Create a library of cell styles.
     */
    private static Map<String, XSSFCellStyle> createStyles(XSSFWorkbook wb){
        Map<String, XSSFCellStyle> styles = new HashMap<String, XSSFCellStyle>();
        XSSFDataFormat fmt = wb.createDataFormat();

        XSSFCellStyle style1 = wb.createCellStyle();
        style1.setAlignment(HorizontalAlignment.RIGHT);
        style1.setDataFormat(fmt.getFormat("0.0%"));
        styles.put("percent", style1);

        XSSFCellStyle style2 = wb.createCellStyle();
        style2.setAlignment(HorizontalAlignment.CENTER);
        style2.setDataFormat(fmt.getFormat("0.0X"));
        styles.put("coeff", style2);

        XSSFCellStyle style3 = wb.createCellStyle();
        style3.setAlignment(HorizontalAlignment.RIGHT);
        style3.setDataFormat(fmt.getFormat("$#,##0.00"));
        styles.put("currency", style3);

        XSSFCellStyle style4 = wb.createCellStyle();
        style4.setAlignment(HorizontalAlignment.RIGHT);
        style4.setDataFormat(fmt.getFormat("mmm dd"));
        styles.put("date", style4);

        XSSFCellStyle style5 = wb.createCellStyle();
        XSSFFont headerFont = wb.createFont();
        headerFont.setBold(true);
        style5.setFillForegroundColor(IndexedColors.GREY_25_PERCENT.getIndex());
        style5.setFillPattern(FillPatternType.SOLID_FOREGROUND);
        style5.setFont(headerFont);
        styles.put("header", style5);

        return styles;
    }

    private static void generate(Writer out, Map<String, XSSFCellStyle> styles) throws Exception {

        Random rnd = new Random();
        Calendar calendar = Calendar.getInstance();

        SpreadsheetWriter sw = new SpreadsheetWriter(out);
        sw.beginSheet();

        //insert header row
        sw.insertRow(0);
        int styleIndex = styles.get("header").getIndex();
        sw.createCell(0, "Title", styleIndex);
        sw.createCell(1, "% Change", styleIndex);
        sw.createCell(2, "Ratio", styleIndex);
        sw.createCell(3, "Expenses", styleIndex);
        sw.createCell(4, "Date", styleIndex);

        sw.endRow();

        //write data rows
        for (int rownum = 1; rownum < 100; rownum++) {
            sw.insertRow(rownum);

            sw.createCell(0, "Hello, " + rownum + "!");
            sw.createCell(1, (double)rnd.nextInt(100)/100, styles.get("percent").getIndex());
            sw.createCell(2, (double)rnd.nextInt(10)/10, styles.get("coeff").getIndex());
            sw.createCell(3, rnd.nextInt(10000), styles.get("currency").getIndex());
            sw.createCell(4, calendar, styles.get("date").getIndex());

            sw.endRow();

            calendar.roll(Calendar.DAY_OF_YEAR, 1);
        }
        sw.endSheet();
    }

    /**
     *
     * @param zipfile the template file
     * @param tmpfile the XML file with the sheet data
     * @param entry the name of the sheet entry to substitute, e.g. xl/worksheets/sheet1.xml
     * @param out the stream to write the result to
     */
    private static void substitute(File zipfile, File tmpfile, String entry, OutputStream out) throws IOException {
        ZipFile zip = ZipHelper.openZipFile(zipfile);
        try {
            ZipOutputStream zos = new ZipOutputStream(out);
    
            Enumeration<? extends ZipEntry> en = zip.entries();
            while (en.hasMoreElements()) {
                ZipEntry ze = en.nextElement();
                if(!ze.getName().equals(entry)){
                    zos.putNextEntry(new ZipEntry(ze.getName()));
                    InputStream is = zip.getInputStream(ze);
                    copyStream(is, zos);
                    is.close();
                }
            }
            zos.putNextEntry(new ZipEntry(entry));
            InputStream is = new FileInputStream(tmpfile);
            copyStream(is, zos);
            is.close();
    
            zos.close();
        } finally {
            zip.close();
        }
    }

    private static void copyStream(InputStream in, OutputStream out) throws IOException {
        byte[] chunk = new byte[1024];
        int count;
        while ((count = in.read(chunk)) >=0 ) {
          out.write(chunk,0,count);
        }
    }

    /**
     * Writes spreadsheet data in a Writer.
     * (YK: in future it may evolve in a full-featured API for streaming data in Excel)
     */
    public static class SpreadsheetWriter {
        private final Writer _out;
        private int _rownum;

        public SpreadsheetWriter(Writer out){
            _out = out;
        }

        public void beginSheet() throws IOException {
            _out.write("<?xml version=\"1.0\" encoding=\""+XML_ENCODING+"\"?>" +
                    "<worksheet xmlns=\"http://schemas.openxmlformats.org/spreadsheetml/2006/main\">" );
            _out.write("<sheetData>\n");
        }

        public void endSheet() throws IOException {
            _out.write("</sheetData>");
            _out.write("</worksheet>");
        }

        /**
         * Insert a new row
         *
         * @param rownum 0-based row number
         */
        public void insertRow(int rownum) throws IOException {
            _out.write("<row r=\""+(rownum+1)+"\">\n");
            this._rownum = rownum;
        }

        /**
         * Insert row end marker
         */
        public void endRow() throws IOException {
            _out.write("</row>\n");
        }

        public void createCell(int columnIndex, String value, int styleIndex) throws IOException {
            String ref = new CellReference(_rownum, columnIndex).formatAsString();
            _out.write("<c r=\""+ref+"\" t=\"inlineStr\"");
            if(styleIndex != -1) _out.write(" s=\""+styleIndex+"\"");
            _out.write(">");
            _out.write("<is><t>"+value+"</t></is>");
            _out.write("</c>");
        }

        public void createCell(int columnIndex, String value) throws IOException {
            createCell(columnIndex, value, -1);
        }

        public void createCell(int columnIndex, double value, int styleIndex) throws IOException {
            String ref = new CellReference(_rownum, columnIndex).formatAsString();
            _out.write("<c r=\""+ref+"\" t=\"n\"");
            if(styleIndex != -1) _out.write(" s=\""+styleIndex+"\"");
            _out.write(">");
            _out.write("<v>"+value+"</v>");
            _out.write("</c>");
        }

        public void createCell(int columnIndex, double value) throws IOException {
            createCell(columnIndex, value, -1);
        }

        public void createCell(int columnIndex, Calendar value, int styleIndex) throws IOException {
            createCell(columnIndex, DateUtil.getExcelDate(value, false), styleIndex);
        }
    }
	
}

(注:本文由Elim写于2017年6月5日)

 

0
1
分享到:
评论
1 楼 masuweng 2017-06-20  
       

相关推荐

    java导出30万数据量的excel(采用生成多个excel,最后打包zip)

    本项目针对这一问题提出了一种解决方案,即分块生成多个Excel文件,然后将它们打包成ZIP文件供用户下载。下面我们将详细探讨这一过程涉及的关键知识点。 1. **Java处理Excel**: Java中常用的库有Apache POI和...

    数据库数据快速生成Excel

    标题提到的“数据库数据快速生成Excel”是一项实用的技术,它可以帮助用户快速地将存储在数据库中的大量数据导出为Excel文件,方便进一步的数据处理和分析。描述中指出,这个方法可以避免手动选定Excel单元格的繁琐...

    SpringBootMybatis+poi+Thymeleaf实现excel文件数据导入到数据库以及从数据库将数据导出成excel.zip

    10. **性能优化**: 如果处理大量数据,可能需要考虑性能优化,如批处理操作、线程池处理、数据库连接池等技术,以提高数据导入和导出的效率。 总的来说,这个项目展示了如何在Java环境中,结合Spring Boot的便利性...

    golang实现的读取excel模板批量生成excel工具.zip

    在处理批量数据生成任务时,如批量生成Excel文件,Go语言往往能提供高效的解决方案。本项目"golang实现的读取excel模板批量生成excel工具"正是基于这一需求而设计的,它允许用户通过读取一个Excel模板来快速创建多个...

    ASP生成EXCEL并自动下载

    因此,对于大量用户的高并发场景,可能需要寻找更高效的解决方案,如使用第三方库(如EPPlus)或者直接生成CSV或OpenXML格式的文件。 综上所述,"ASP生成EXCEL并自动下载"技术涉及了服务器端脚本、数据格式化、HTTP...

    基于LabVIEW的Excel报表生成技术研究

    这对于需要频繁处理大量数据的实验室或工业环境来说,是一个非常有价值的解决方案。此外,这种集成方式还可以进一步扩展到其他类型的文档生成,如PDF或HTML报表,进一步提升系统的灵活性和实用性。

    Java处理100万行超大Excel文件秒级响应

    EasyExcel是一个基于Java的简单、易用且高效的Excel处理工具,它支持读写Excel文件,并且能够有效地避免内存溢出问题。 **EasyExcel特点:** - **内存消耗低:** EasyExcel使用流式处理的方式读取Excel文件,只在...

    基于NPOI导入导出Excel文件.rar

    通过这种方式,开发者可以方便地进行大量数据的导入导出操作,提高工作效率。 1. **C#编程语言**:C#是.NET框架的基础,是一种面向对象的编程语言,广泛应用于开发Windows桌面应用、Web应用和移动应用等。在这个...

    Qt操作excel文件,基于QAxObject的封装,适用windows系统.zip

    在本文中,我们将深入探讨如何...这对于那些需要处理大量结构化数据,尤其是进行数据分析、报表生成的毕业设计项目来说,是一个理想的解决方案。记住,始终确保在实际应用中遵循最佳实践,保证代码的健壮性和可维护性。

    一个基于C#+ASP.NET实现的可以生成 XML格式的Excel 文件类库源码

    使用XML格式生成Excel文件,可以避免传统二进制格式(如XLSX)对内存和处理速度的影响,尤其在处理大量数据时更为高效。 这个类库源码的核心可能包括以下几个关键部分: 1. **Excel工作簿和工作表创建**:在XML...

    基于PHP的excel reader php版 Excel开发包.zip

    "基于PHP的excel reader php版 Excel开发包.zip" 提供了一个专门用于读取Excel文件的解决方案,这在处理大量数据导入、导出或者报表生成时非常有用。 该开发包主要面向PHP开发者,允许他们在服务器端处理Excel文件...

    word文件生成工具

    总的来说,"word文件生成工具"是一个高效实用的解决方案,它简化了大量Word文档的制作流程,特别是在需要根据模板和数据源批量生成文件的场景下。掌握这类工具的使用,可以极大地提高工作效率,减少重复劳动,是IT...

    基于vb的Excel二次开发

    在IT领域,基于VB(Visual Basic)的Excel二次开发是一种常见的技术实践,它允许程序员通过编程方式对Excel的功能...无论是处理大量数据、生成复杂报告还是实现复杂的计算逻辑,VB与Excel的结合都能提供强大的支持。

    C#数据导出至Excel表格,运用NPOI,ClosedXML两种方式实现

    通常,ClosedXML由于其优化的内部实现,在写入速度上可能优于NPOI,尤其是在处理大量数据时。然而,NPOI可能更适合处理较旧的Excel格式(如XLS),或者在需要更多低级控制的情况下。 为了确保程序在没有安装Office...

    基于Excel的报表生成系统的实现.pdf

    以洛阳石化铁路运输调度管理系统为例,该系统成功地应用了基于Excel的报表生成方案,证明了该方法的可行性。通过实际案例,我们可以看到,这种系统能够有效地处理和展示铁路运输的大量数据,帮助管理层做出决策,...

    利用VB操作EXCEL来生成复杂的报表

    在VB中,生成报表的第一步通常是打开或创建Excel文件。这可以通过`Workbooks.Open`或`Workbooks.Add`方法实现。例如: ```vb Dim xlApp As Excel.Application Dim xlWB As Excel.Workbook Set xlApp = New Excel....

    ASP.NET导入导出excel文件数据类

    在ASP.NET中,导入和导出Excel文件是常见的需求,特别是在数据处理和报表生成场景下。这个主题主要涉及两个版本的Microsoft Excel文件格式:2003(xls)和2007以后的版本(xlsx)。这两种格式在内部存储结构上有所...

    Android中生成excel用到的jar文件.rar

    这里提到的"Android中生成excel用到的jar文件.rar"是一个包含关键库的压缩包,主要包含了一个名为"jxl.jar"的Java库,用于在Android应用中生成Excel文件。现在我们将详细讨论如何利用这个库以及相关的知识点。 1. *...

    Json、excel文件相互转换工具

    本工具"Json、excel文件相互转换工具"提供了一个方便快捷的解决方案,使用户能够在JSON与Excel之间轻松转换。以下是关于这两种格式及其转换的知识点: 1. **JSON文件转换为Excel文件**: - JSON文件通常包含键值对...

    基于.Net的Excel读写管理类库

    基于.NET的Excel读写管理类库为开发者提供了便捷的方式来操作Excel文件,而"ExcelManager--基于.Net的Excel读写管理类库"正是这样一个工具。这个类库允许开发者在不依赖Microsoft Office的情况下,高效地进行Excel...

Global site tag (gtag.js) - Google Analytics