`

使用POI操作Excel的几点注意事项

    博客分类:
  • Java
阅读更多
首先说说现在我所知道的Java编辑Excel文件的两大开源工具:

jakarta POI和JavaExcelAPI(简称JXL),这两套工具我都试用了一这段时间,感觉各有优劣吧。POI在某些细节有些小Bug并且不支持写入图片,其他方面都挺不错的;

JXL就惨了,除了支持写入图片外,我暂时看不到它比POI好的地方,我碰到的主要的问题就是对公式支持不是很好,很多带有公式的Excel文件用JXL 打开后,公式就丢失了(比如now(),today()),在网上看到其他大虾评论说JXL写入公式也有问题,另外,JXL操作Excel文件的效率比 POI低一点。经过比较后,我选择了POI开发我的项目。

现在我要做的东西基本完成啦,我把这段时间使用POI的一些心得总结出来,希望能对和我遇到相同问题的朋友有所帮助,至于POI基本的使用方法,自己去看文档吧。
  1. 设置分页符的bug

  2. POI里的HSSFSheet类提供了setRowBreak方法可以设置Sheet的分页符。

    Bug:如果你要设置分页符的Sheet是本来就有的,并且你没有在里面插入过分页符,那么调用setRowBreak时POI会抛出空指针的异常。

    解决方法:在Excel里给这个sheet插入一个分页符,用POI打开后再把它删掉,然后你就可以随意插入分页符了。

    如果sheet是由POI生成的则没有这个问题。我跟踪了setRowBreak的源代码,发现是Sheet.Java下的 PageBreakRecord rowBreaks这个变量在搞鬼,如果Sheet里原来没有分页符,开发这个模块的那位兄台忘了为这个对象new实例,所以只能我们先手工给Excel 插入一个分页符来触发POI为rowBreaks创建实例。
  3. 如何拷贝行

  4. 我在gmane.org的POI用户论坛翻遍了每个相关的帖子,找遍了api,也没看到一个拷贝行的方法,没办法,只能自己写:

//注:this.fWorkbook是一个HSSHWorkbook,请自行在外部new
public void copyRows(String pSourceSheetName,
        String pTargetSheetName,
        int pStartRow, int pEndRow,
        int pPosition) {
    HSSFRow sourceRow = null;
    HSSFRow targetRow = null;
    HSSFCell sourceCell = null;
    HSSFCell targetCell = null;
    HSSFSheet sourceSheet = null;
    HSSFSheet targetSheet = null;
    Region region = null;
    int cType;
    int i;
    short j;
    int targetRowFrom;
    int targetRowTo;

    if ((pStartRow == -1) || (pEndRow == -1)) {
        return;
    }
    sourceSheet = this.fWorkbook.getSheet(pSourceSheetName);
    targetSheet = this.fWorkbook.getSheet(pTargetSheetName);
		//拷贝合并的单元格
    for (i = 0; i < sourceSheet.getNumMergedRegions(); i++) {
        region = sourceSheet.getMergedRegionAt(i);
        if ((region.getRowFrom() >= pStartRow) && (region.getRowTo() <= pEndRow)) {
            targetRowFrom = region.getRowFrom() - pStartRow + pPosition;
            targetRowTo = region.getRowTo() - pStartRow + pPosition;
            region.setRowFrom(targetRowFrom);
            region.setRowTo(targetRowTo);
            targetSheet.addMergedRegion(region);
        }
    }
		//设置列宽
    for (i = pStartRow; i <= pEndRow; i++) {
        sourceRow = sourceSheet.getRow(i);
        if (sourceRow != null) {
            for (j = sourceRow.getFirstCellNum(); j < sourceRow.getLastCellNum(); j++) {
                targetSheet.setColumnWidth(j, sourceSheet.getColumnWidth(j));
            }
            break;
        }
    }
		//拷贝行并填充数据
    for (; i <= pEndRow; i++) {
        sourceRow = sourceSheet.getRow(i);
        if (sourceRow == null) {
            continue;
        }
        targetRow = targetSheet.createRow(i - pStartRow + pPosition);
        targetRow.setHeight(sourceRow.getHeight());
        for (j = sourceRow.getFirstCellNum(); j < sourceRow.getLastCellNum(); j++) {
            sourceCell = sourceRow.getCell(j);
            if (sourceCell == null) {
                continue;
            }
            targetCell = targetRow.createCell(j);
            targetCell.setEncoding(sourceCell.getEncoding());
            targetCell.setCellStyle(sourceCell.getCellStyle());
            cType = sourceCell.getCellType();
            targetCell.setCellType(cType);
            switch (cType) {
                case HSSFCell.CELL_TYPE_BOOLEAN:
                    targetCell.setCellValue(sourceCell.getBooleanCellValue());
                    break;
                case HSSFCell.CELL_TYPE_ERROR:
                    targetCell.setCellErrorValue(sourceCell.getErrorCellValue());
                    break;
                case HSSFCell.CELL_TYPE_FORMULA:
										//parseFormula这个函数的用途在后面说明
                    targetCell.setCellFormula(parseFormula(sourceCell.getCellFormula()));
                    break;
                case HSSFCell.CELL_TYPE_NUMERIC:
                    targetCell.setCellValue(sourceCell.getNumericCellValue());
                    break;
                case HSSFCell.CELL_TYPE_STRING:
                    targetCell.setCellValue(sourceCell.getStringCellValue());
                    break;
            }
        }
    }
}

这个函数有两个问题暂时无法解决:

a、只能在同一个Workbook里面使用,跨Workbook总是拷不过去,不知道为什么?

b、由于在拷贝行时也把行高也拷过去了,如果往这些单元格里写入的数据长度超过单元格长度,那么他们不会自动调整行高!

3、公式的问题

POI对Excel公式的支持是相当好的,但是我发现一个问题,如果公式里面的函数不带参数,比如now()或today(),那么你通过 getCellFormula()取出来的值就是now(ATTR(semiVolatile))和today(ATTR (semiVolatile)),这样的值写入Excel是会出错的,这也是我上面copyRow的函数在写入公式前要调用parseFormula的原因,parseFormula这个函数的功能很简单,就是把ATTR(semiVolatile)删掉,我把它的代码贴出来:
private String parseFormula(String pPOIFormula) {
    final String cstReplaceString = "ATTR(semiVolatile)"; //$NON-NLS-1$
    StringBuffer result = null;
    int index;

    result = new StringBuffer();
    index = pPOIFormula.indexOf(cstReplaceString);
    if (index >= 0) {
        result.append(pPOIFormula.substring(0, index));
        result.append(pPOIFormula.substring(index + cstReplaceString.length()));
    } else {
        result.append(pPOIFormula);
    }

    return result.toString();
}

至于为什么会出现ATTR(semiVolatile),还需要大家的探索精神!
public boolean drawImage(Image image, int dx1, int dy1, int dx2, int dy2,
 				int sx1, int sy1, int sx2, int sy2, Color bgColor, ImageObserver imageobserver) {
    if (logger.check(POILogger.WARN)) {
        logger.log(POILogger.WARN, "drawImage() not supported");
    }
    return true;
}

所以我强烈建议大家,以后使用第三方开发包一定尽量下载它的源代码,这样你在碰到问题时,看看它的的内部是怎么实现的,很多时候就可以不必重蹈我的覆辙了。既然POI不能写入图片,那我们只能把目光投向JXL,我用JXL写入图片功能是实现了,付出的代价是now()和today()这些函数丢失掉了,鱼与熊掌不能兼得吧。 (T117)
分享到:
评论
1 楼 abx01 2008-03-24  
楼主的总结比较全

楼主的头像好可爱

相关推荐

    基于poi的excel导入.doc

    在使用POI读取Excel文档时,需要注意以下几点: 1. Excel文档的版本:POI支持多种Excel文档版本,包括xls、xlsx等。 2. 文档编码:POI支持多种文档编码,包括GBK、UTF-8等。 3. 单元格格式:POI支持多种单元格格式...

    poi导出excel参考方法

    9. 使用POI的注意事项 在使用POI时,需要注意以下几点:首先,需要安装相关的依赖项。其次,需要 imports 相关的Package。最后,需要正确地使用POI的API。 10. POI的未来发展 POI的未来发展方向是继续完善文档...

    POI 3.8 Beta5 创建大数据量 Excel文件

    标题中的“POI 3.8 Beta5”指的是Apache POI项目的一个版本,这是一个流行的开源Java库,用于读取、写入和修改Microsoft Office格式...通过掌握上述技巧和注意事项,可以有效地创建和操作Excel文件,满足各种业务需求。

    poi解析Excel

    使用Apache POI解析Excel时,有以下几个关键知识点: 1. **创建工作簿**:首先需要创建一个工作簿对象,这可以是HSSFWorkbook或XSSFWorkbook,根据需要处理的Excel文件类型来决定。 2. **添加工作表**:工作簿对象...

    POI读取Excel大文件.rar

    6. **性能注意事项** - 尽量使用SXSSF而非XSSF,因为XSSF在处理大数据时内存消耗更大。 - 避免在循环中创建不必要的对象,如字符串常量池可以减少内存分配。 - 使用适当的数据类型,例如数字而不是字符串,减少...

    poi导出excel

    在了解如何使用Apache POI进行Excel导出之前,我们需要先了解几个重要的类: 1. **HSSFWorkbook**:代表一个Excel工作簿。 2. **HSSFSheet**:代表工作簿中的一个工作表。 3. **HSSFRow**:代表工作表中的一行。 4....

    poi 生成excel

    9. **最佳实践与注意事项**:教程可能还会分享一些使用POI的最佳实践,比如内存管理和性能优化,以及避免常见的错误和陷阱。 标签中的“源码”意味着可能会深入到Apache POI的源代码层面,讲解某些功能的工作原理或...

    poi-4.1.2需要的jar包.zip

    9. **注意事项**:处理大型Excel文件时,需要注意内存管理,因为POI会将整个工作簿加载到内存中。可以使用SXSSF API来实现流式处理,以降低内存消耗。 10. **版本更新**:Apache POI持续进行版本迭代,每次更新都会...

    POI预处理.docx

    《POI数据预处理在ArcMap中的操作及注意事项》 POI(Point of Interest),即兴趣点数据,广泛应用于地理信息系统(GIS)中,用于表示特定地理位置,如餐馆、公园、医院等。对POI数据进行预处理是数据分析的重要...

    POI通用导出Excel(.xls,.xlsx)的方法

    在使用POI导出Excel时,需要注意以下几点: * 文件流的关闭:在导出EXCEL文件时,需要确保文件流的关闭,以免导致内存溢出和连接阻塞。 * 内存占用:在使用XSSF生成Excel 2007 OOXML (.xlsx)格式的文件时,需要注意...

    asp.net NPOI操作Excel

    根据提供的文件信息,我们可以总结出以下几个关键的知识点: ### ASP.NET 使用 NPOI 操作 Excel 的背景 在 Web 开发领域,尤其是使用 ASP.NET 进行开发时,经常需要处理 Excel 文件,例如导出数据到 Excel 或从 ...

    POI插件下载

    ### 使用POI插件的注意事项 在使用POI插件的过程中,还需要注意以下几个方面: - **兼容性问题**:确保所使用的POI版本与项目中其他库的兼容性,避免出现冲突。 - **性能优化**:对于大数据量的处理,需要注意内存...

    poi3.10final.jar.zip

    通常,它会包含API概述、基本用法示例、注意事项以及可能遇到的问题的解决方案。对于初学者来说,这是一个非常重要的资源,因为它可以帮助快速理解和应用POI。 3. **淘宝优惠券.url**: 这可能是一个链接到淘宝优惠...

    VC操作Excel文件

    在IT行业中,尤其是在软件开发领域,使用VC++(Visual C++)进行文件操作是一项常见的任务。本主题聚焦于“VC操作Excel文件”,...同时,了解并熟练掌握相关API和注意事项,将有助于编写出高效、稳定且易于维护的代码。

    解析excel、生成excel所需要的jar包

    4. **注意事项**: - 保持库版本的一致性,避免因不同版本间的不兼容问题导致错误。 - 大型文件处理时注意内存管理,因为POI可能会将整个工作簿加载到内存中。 - 使用流式处理方式可以降低内存消耗,特别是处理...

    Java使用Apache POI库读取Excel表格文档的示例

    以下是关于使用Apache POI读取Excel表格文档的关键知识点: 1. **Apache POI的组成部分**: - HSSF:处理Excel的老式BIFF格式(XLS),适用于Excel 97-2007。 - XSSF:处理Excel的OOXML格式(XLSX),适用于Excel...

    java_word_poi_demo

    Java Word POI Demo是一个关于如何使用Java编程语言和Apache POI库来操作Microsoft Word文档的示例项目。Apache POI是开源项目,专门用于读取、写入和修改Microsoft Office格式的文件,包括Word(.doc和.docx)、...

    android 读写Excel(支持xlsx xls格式)

    本文将详细讲解如何在Android中实现对.xlsx和.xls格式的Excel文件进行读写,主要涉及的技术点包括文件操作、数据解析以及第三方库的使用。 一、文件操作基础 在Android中,文件操作通常涉及到以下几个步骤: 1. ...

    java利用jxl工具包操作Excel文件.pdf

    使用 jxl 库时,需要注意以下几点: - jxl 支持的文件格式主要为 .xls,不支持 Office 2007 及以上版本的 .xlsx 文件。 - 读取和写入操作可能抛出 IOException,需要进行异常处理。 - 为了释放资源,读写完成后...

    java的Excel导入导出源码

    包含的“J2EE项目开发Excel导入导出操作组件源代码(附带说明文档)”很可能是项目开发的指南,详细解释了源码的使用方法、注意事项以及可能出现的问题,这对于理解和使用这些源码非常有帮助。 通过学习这个源码,...

Global site tag (gtag.js) - Google Analytics