`
xpenxpen
  • 浏览: 734743 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

写Excel 2007大文件的一个取巧方法

阅读更多
1.问题
POI来读写excel文件相信大家都不陌生了。最近项目中有个需求,需要读取一个excel2007格式的模板,然后再写10000条记录到这个excel里,最后输出。本人一开始用poi的user model来写excel,但是测试下来发现内存消耗极大(2G),且需要10分钟才能完成excel的生成。那有没有性能更好更快的方法呢?poi还提供了2种方法,一种是event model,但只支持读,还有一种sxsff,只支持写。由于我们原来excel模板里有许多格式还有控件,vba宏在,需要同时具有读和写的功能。所以这2种方法都不行。

2.取巧方法
本人在这里找到的方法:http://vikramvkamath.blogspot.com/2010/07/writing-large-excel-files-excel-2007.html

原理:excel2007格式文件其实就是一个zip压缩包。可以用7zip等压缩软件打开。解压出来结构如下:
/
- ..
- _rels
- .rels
- docProps
- app.xml
- core.xml
- xl
- _rels
- worksheets
- sheet1.xml
- sheet2.xml
- sharedStrings.xml
- styles.xml
- workbook.xml
- [Content_Types].xml


如上红色的sheet2.xml打开看一下,你会发现这是第二个sheet的数据文件。所以这个取巧的方法就是用java来写这个xml文件,然后再重新打回压缩包里。写xml的话就比写xlsx快许多了。

上个代码示例,来源是去下载poi的源代码包,找到里面的examples。或者去这里查看

import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.io.OutputStream;
import java.io.OutputStreamWriter;
import java.io.Writer;
import java.util.Calendar;
import java.util.Enumeration;
import java.util.HashMap;
import java.util.Map;
import java.util.Random;
import java.util.zip.ZipEntry;
import java.util.zip.ZipFile;
import java.util.zip.ZipOutputStream;

import org.apache.poi.ss.usermodel.DateUtil;
import org.apache.poi.ss.usermodel.IndexedColors;
import org.apache.poi.ss.util.CellReference;
import org.apache.poi.xssf.usermodel.XSSFCellStyle;
import org.apache.poi.xssf.usermodel.XSSFDataFormat;
import org.apache.poi.xssf.usermodel.XSSFFont;
import org.apache.poi.xssf.usermodel.XSSFSheet;
import org.apache.poi.xssf.usermodel.XSSFWorkbook;

/**
 * Demonstrates a workaround you can use to generate large workbooks and avoid OutOfMemory exception.
 *
 * The trick is as follows:
 * 1. create a template workbook, create sheets and global objects such as cell styles, number formats, etc.
 * 2. create an application that streams data in a text file
 * 3. Substitute the sheet in the template with the generated data
 *
 * @author Yegor Kozlov
 */
public class BigGridDemo {
    private static final String XML_ENCODING = "UTF-8";
    
    public static void main(String[] args) throws Exception {

        // Step 1. Create a template file. Setup sheets and workbook-level objects such as
        // cell styles, number formats, etc.

        XSSFWorkbook wb = new XSSFWorkbook();
        XSSFSheet sheet = wb.createSheet("Big Grid");

        Map<String, XSSFCellStyle> styles = createStyles(wb);
        //name of the zip entry holding sheet data, e.g. /xl/worksheets/sheet1.xml
        String sheetRef = sheet.getPackagePart().getPartName().getName();

        //save the template
        FileOutputStream os = new FileOutputStream("template.xlsx");
        wb.write(os);
        os.close();

        //Step 2. Generate XML file.
        File tmp = new File("sheet.xml");
        Writer fw = new OutputStreamWriter(new FileOutputStream(tmp), XML_ENCODING);
        generate(fw, styles);
        fw.close();

        //Step 3. Substitute the template entry with the generated data
        FileOutputStream out = new FileOutputStream("big-grid.xlsx");
        substitute(new File("template.xlsx"), tmp, sheetRef.substring(1), out);
        out.close();
    }

    /**
     * Create a library of cell styles.
     */
    private static Map<String, XSSFCellStyle> createStyles(XSSFWorkbook wb){
        Map<String, XSSFCellStyle> styles = new HashMap<String, XSSFCellStyle>();
        XSSFDataFormat fmt = wb.createDataFormat();

        XSSFCellStyle style1 = wb.createCellStyle();
        style1.setAlignment(XSSFCellStyle.ALIGN_RIGHT);
        style1.setDataFormat(fmt.getFormat("0.0%"));
        styles.put("percent", style1);

        XSSFCellStyle style2 = wb.createCellStyle();
        style2.setAlignment(XSSFCellStyle.ALIGN_CENTER);
        style2.setDataFormat(fmt.getFormat("0.0X"));
        styles.put("coeff", style2);

        XSSFCellStyle style3 = wb.createCellStyle();
        style3.setAlignment(XSSFCellStyle.ALIGN_RIGHT);
        style3.setDataFormat(fmt.getFormat("$#,##0.00"));
        styles.put("currency", style3);

        XSSFCellStyle style4 = wb.createCellStyle();
        style4.setAlignment(XSSFCellStyle.ALIGN_RIGHT);
        style4.setDataFormat(fmt.getFormat("mmm dd"));
        styles.put("date", style4);

        XSSFCellStyle style5 = wb.createCellStyle();
        XSSFFont headerFont = wb.createFont();
        headerFont.setBold(true);
        style5.setFillForegroundColor(IndexedColors.GREY_25_PERCENT.getIndex());
        style5.setFillPattern(XSSFCellStyle.SOLID_FOREGROUND);
        style5.setFont(headerFont);
        styles.put("header", style5);

        return styles;
    }

    private static void generate(Writer out, Map<String, XSSFCellStyle> styles) throws Exception {

        Random rnd = new Random();
        Calendar calendar = Calendar.getInstance();

        SpreadsheetWriter sw = new SpreadsheetWriter(out);
        sw.beginSheet();

        //insert header row
        sw.insertRow(0);
        int styleIndex = styles.get("header").getIndex();
        sw.createCell(0, "Title", styleIndex);
        sw.createCell(1, "% Change", styleIndex);
        sw.createCell(2, "Ratio", styleIndex);
        sw.createCell(3, "Expenses", styleIndex);
        sw.createCell(4, "Date", styleIndex);

        sw.endRow();

        //write data rows
        for (int rownum = 1; rownum < 100000; rownum++) {
            sw.insertRow(rownum);

            sw.createCell(0, "Hello, " + rownum + "!");
            sw.createCell(1, (double)rnd.nextInt(100)/100, styles.get("percent").getIndex());
            sw.createCell(2, (double)rnd.nextInt(10)/10, styles.get("coeff").getIndex());
            sw.createCell(3, rnd.nextInt(10000), styles.get("currency").getIndex());
            sw.createCell(4, calendar, styles.get("date").getIndex());

            sw.endRow();

            calendar.roll(Calendar.DAY_OF_YEAR, 1);
        }
        sw.endSheet();
    }

    /**
     *
     * @param zipfile the template file
     * @param tmpfile the XML file with the sheet data
     * @param entry the name of the sheet entry to substitute, e.g. xl/worksheets/sheet1.xml
     * @param out the stream to write the result to
     */
	private static void substitute(File zipfile, File tmpfile, String entry, OutputStream out) throws IOException {
        ZipFile zip = new ZipFile(zipfile);

        ZipOutputStream zos = new ZipOutputStream(out);

        @SuppressWarnings("unchecked")
        Enumeration<ZipEntry> en = (Enumeration<ZipEntry>) zip.entries();
        while (en.hasMoreElements()) {
            ZipEntry ze = en.nextElement();
            if(!ze.getName().equals(entry)){
                zos.putNextEntry(new ZipEntry(ze.getName()));
                InputStream is = zip.getInputStream(ze);
                copyStream(is, zos);
                is.close();
            }
        }
        zos.putNextEntry(new ZipEntry(entry));
        InputStream is = new FileInputStream(tmpfile);
        copyStream(is, zos);
        is.close();

        zos.close();
    }

    private static void copyStream(InputStream in, OutputStream out) throws IOException {
        byte[] chunk = new byte[1024];
        int count;
        while ((count = in.read(chunk)) >=0 ) {
          out.write(chunk,0,count);
        }
    }

    /**
     * Writes spreadsheet data in a Writer.
     * (YK: in future it may evolve in a full-featured API for streaming data in Excel)
     */
    public static class SpreadsheetWriter {
        private final Writer _out;
        private int _rownum;

        public SpreadsheetWriter(Writer out){
            _out = out;
        }

        public void beginSheet() throws IOException {
            _out.write("<?xml version=\"1.0\" encoding=\""+XML_ENCODING+"\"?>" +
                    "<worksheet xmlns=\"http://schemas.openxmlformats.org/spreadsheetml/2006/main\">" );
            _out.write("<sheetData>\n");
        }

        public void endSheet() throws IOException {
            _out.write("</sheetData>");
            _out.write("</worksheet>");
        }

        /**
         * Insert a new row
         *
         * @param rownum 0-based row number
         */
        public void insertRow(int rownum) throws IOException {
            _out.write("<row r=\""+(rownum+1)+"\">\n");
            this._rownum = rownum;
        }

        /**
         * Insert row end marker
         */
        public void endRow() throws IOException {
            _out.write("</row>\n");
        }

        public void createCell(int columnIndex, String value, int styleIndex) throws IOException {
            String ref = new CellReference(_rownum, columnIndex).formatAsString();
            _out.write("<c r=\""+ref+"\" t=\"inlineStr\"");
            if(styleIndex != -1) _out.write(" s=\""+styleIndex+"\"");
            _out.write(">");
            _out.write("<is><t>"+value+"</t></is>");
            _out.write("</c>");
        }

        public void createCell(int columnIndex, String value) throws IOException {
            createCell(columnIndex, value, -1);
        }

        public void createCell(int columnIndex, double value, int styleIndex) throws IOException {
            String ref = new CellReference(_rownum, columnIndex).formatAsString();
            _out.write("<c r=\""+ref+"\" t=\"n\"");
            if(styleIndex != -1) _out.write(" s=\""+styleIndex+"\"");
            _out.write(">");
            _out.write("<v>"+value+"</v>");
            _out.write("</c>");
        }

        public void createCell(int columnIndex, double value) throws IOException {
            createCell(columnIndex, value, -1);
        }

        public void createCell(int columnIndex, Calendar value, int styleIndex) throws IOException {
            createCell(columnIndex, DateUtil.getExcelDate(value, false), styleIndex);
        }
    }
}


3.性能比较
使用了这个诡计以后,读取excel模板并写10000条记录到excel并生成从原来的10分钟变成了3秒!性能有了飞跃。
分享到:
评论

相关推荐

    QT使用 Linux framebuffer时候 支持QT本身不支持的其他格式(例如支持argb4444)的一种取巧方法

    关键在于自定义一个屏幕设备类,继承自Qt的QScreen。这里,我们重点关注`qlinuxfbscreen.cpp`和`qlinuxfbscreen.h`这两个文件。在`qlinuxfbscreen.cpp`中,我们需要重写QScreen的一些关键方法,特别是与像素格式相关...

    利用PHPExcel实现Excel文件的写入和读取

    PHPExcel 是一个用于处理 Excel 文件的 PHP 类库。它允许开发者在不依赖其他软件的情况下,通过 PHP 语言来创建、读取、修改 Excel 文件。这对于需要处理大量数据或进行数据导入导出的应用来说非常有用。 **安装...

    深度解析:既然C编译器是C语言写的那第一个C编译器是怎样来的 硬件工程师电路分析物联网模电单片机嵌入式技术.doc

    * 早期的 C 编译器采取了一个取巧的办法:先用汇编语言编写一个 C 语言的一个子集的编译器,再通过这个子集去递推完成完整的 C 语言编译器 知识点 3:Self-Compile 理论 * Self-Compile 理论是指对于某些具有明显...

    flash动画分解器(我叫它取巧器)

    flash动画分解器(我叫它取巧器),用来分解一下朋友的FLASH,为自己所用。

    学生求职中遇到的问题及解决方法

    10写自荐信需要注意的几个问题2007-3-9 11如何填写毕业生推荐表?2007-3-9 12怎样写好自荐信?2007-3-9 13面试如何坦诚相待2007-2-14 14面试故事:先去敲门2007-2-14 15应聘简历石沉大海缘何故?2007-2-14 16用会...

    Vue 实现从文件中获取文本信息的方法详解

    本文实例讲述了Vue 实现从文件中获取文本信息的方法。分享给大家供大家参考,具体如下: ...无奈之下,想到了一个既简单又比较取巧的方法,使用export来实现。 实现的思路: 1.新建一个.js文件,在

    PPT保存字体的三个方法.rar

    PPT保存字体的三个方法。最粗暴的方法:整个PPT直接导出为图片,优点是简单快捷,缺点是不能设置动画,不能修改。最高端的方法:所有PPT字体嵌入PPT文件中,优点是所有部分可以修改,缺点是某些有版权的字体不可以...

    jQuery实现瀑布流的取巧做法分享

    由于JavaScript原生的Math.min()函数一次最多只能传入两个参数,因此使用apply方法来扩展参数的传递,可以传入一个数组。 2. 绑定滚动事件到window对象。当下拉浏览器窗口时,获取当前滚动条的垂直位置`$(document)...

    彩色图像灰度化沈阳理工大学讲解.docx

    灰度图像的每个像素点用一个字节即可表达,灰度值范围是0到255。在这里,0代表纯黑色,而255则代表纯白色,介于两者之间的灰度值则表示不同程度的灰色。灰度化处理后的图像更利于进行后续的图像分析工作,如边缘检测...

    Android中播放Gif动画取巧的办法

    然而,这里提供了一个巧妙的方法,利用Android的WebView来播放Gif动画,这种方法简单且兼容性良好。 首先,你需要将Gif文件放入Android项目的资源文件夹中,通常是`res/raw`或`assets`目录。将Gif文件放置在`assets...

    Hexo已经看腻了,来手把手教你使用VuePress搭建个人博客

    vuepress是尤大大4月12日发布的一个全新的基于vue的静态网站生成器,实际上就是一个vue的spa应用,内置webpack,可以用来写文档。 一个基于 Vue SSR 的静态站生成器,本来的目的是爽爽的写文档,但是我发现用来撸一...

    EOS操作系统文件系统功能完善

    EOS操作系统是一个小型的开源教学用操作系统,很多高校用它来做本科阶段OS这门课的实验工具,但是这个操作系统本事有很多功能没有实现。借这次OS课程设计的机会我完善了它的文件系统,改进了dir调用,增加了md,rd,...

    基于Javascript实现文件实时加载进度的方法

    不知道大家有没有发现在...但是移动端的访问速度和pc还是有很大的差距,有些时候需要一些取巧的方式来提升用户体验,而实时显示加载进度就是其中一种。这篇文章就给大家分享了Javascript实现文件实时加载进度的方法。

    攻击竞争对手的原则和方法.doc

    企业应该专注于对手的一个弱点,集中资源进行攻击,以期从整体上影响对手渠道体系的效率。例如,一些小品牌采取激励政策吸引二批商,从源头切断竞争对手的通路,使得对方的终端推广效果大打折扣,而自己则因此提升了...

    七年级政治上册 第二课 第一框 学习新天地习题2(无答案) 新人教版 试题.doc

    这篇文档是针对七年级学生的一份政治课程习题,主要关注学习策略和方法。以下是根据题目内容提炼出的相关知识点: 1. **面对成绩波动的应对策略**:小王期中考试成绩不理想,正确的做法是冷静分析原因,找出问题...

    微信域名拦截检测接口最新技术.docx

    微信推广中,域名会由于各种问题变得异常,所以我们会需要域名检测,来实时了解域名情况,检测方法五花八门,体验参差错落,其中有大部分人使用将链接生成短网址的手段来判断域名是否异常,这本身就是一种取巧行为,...

    ImprovedMatrixRain.unitypackage

    因最近有需要要做一个类似骇客帝国数字矩阵的效果,正好发现shadertoy网上有大佬做了一个很取巧的着色器,靠纯shader代码就实现了类似的效果,所以把大佬的代码作为shader练习翻译了一下,在unity环境运行良好。...

    阿里云分布式关系型数据库DRDS-最佳实践.pdf

    该解决方案提供了一个综合的分布式数据库管理系统,可以满足大规模数据存储和处理的需求。 在阿里云分布式关系型数据库DRDS中,数据拆分策略的选择是决定分布式数据的关键因素。需要根据不同的应用场景和业务需求...

    Fog-Of-War-master.zip

    传统的实现方式就是用一张纹理两个通道 一个表示已经探索的区域,另外一个通道表示当前视野可见的区域. 但是使用这张纹理进行迷雾绘制的方式各有各的方式,我参考到的有三种 AsehesL smilehao Ultimate Fog of War ...

Global site tag (gtag.js) - Google Analytics