`
wangzheguilai
  • 浏览: 21204 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类

2010-12-16 Apache POI组件操作Excel,制作报表(一)

阅读更多

    Apache的POI组件是Java操作Microsoft Office办公套件的强大API,其中对Word,Excel和PowperPoint都有支持,当然使用较多的还是Excel,因为Word和PowerPoint用程序动态操作的应用较少。那么本文就结合POI来介绍一下操作Excel的方法。
    Office 2007的文件结构完全不同于2003,所以对于两个版本的Office组件,POI有不同的处理API,分开使用即可。首先来说几个Excel的基本概念。对于一个Excel文件,这称为一个工作簿(Workbook),打开Excel之后,在下方会有sheet1/2/3这样的选项卡,点击可以切换到不同的sheet中,这个sheet称作工作表。每个工作表就是我们编辑的区域,这是一张二维表,阿拉伯数字控制行数,从1开始,而程序中还是0,类似数组和集合。字母控制列数,从A开始,Z以后是两个字母控制。对于每一行,我们称为Row,列就是Column,行列可以确定唯一的一个元素,那么就是单元格,称为Cell。
    POI组件可以方便的操纵这些元素,但初次接触POI可能会有畏惧心理,因为要对每个单元格进行设置,那么不管是用数组还是集合,从工作簿,工作表,行下来的代码量都不会小,这是不能避免的,但是按照这个处理顺序走,就一定可以得到结果。
    有了这些基础的概念之后,我们就可以操作Excel了。先来看一下所需的依赖,因为涉及到2007,就要额外加一些依赖。

    下面从读取Excel开始,首先建立一个Excel 2003以下版本的xls文件。设定几列来看。来存储学生信息的Excel表如下:

    这里的姓名,性别和班级是文本值,而年龄和成绩是数字值,这在设计对象和处理时要注意区分。那么可以如下设计这个对象:
Java代码
package org.ourpioneer.excel.bean; 
/**
* 学生信息

* @author Nanlei

*/ 
public class Student { 
    private String name; 
    private String gender; 
    private int age; 
    private String sclass; 
    private int score; 
    public Student() { 
        super(); 
    } 
    public Student(String name, String gender, int age, String sclass, int score) { 
        super(); 
        this.name = name; 
        this.gender = gender; 
        this.age = age; 
        this.sclass = sclass; 
        this.score = score; 
    } 
//省略了getter和setter方法 
    @Override 
    public String toString() { 
        return "Student [age=" + age + ", gender=" + gender + ", name=" + name 
                + ", sclass=" + sclass + ", score=" + score + "]"; 
    } 


    提供一个有参数的构造方法,用于生成对象写入Excel文档。这个对象就能刻画Excel文件中的数据了,下面就是写程序将Excel文件加载并处理,然后将内容读出,读取顺序是工作簿->工作表->行->单元格。这样一分析就很简单了。我们定义两个Excel文件,内容相同,只是版本不同,分2003和2007来处理。
    创建工作簿时可以接收一个输入流对象,那么输入流对象可以从文件对象来生成,这样就可以继续进行了。取出工作表,取出行,遍历单元格,数据就拿到了。代码如下:
Java代码
package org.ourpioneer.excel; 
import java.io.File; 
import java.io.FileInputStream; 
import java.io.IOException; 
import java.io.InputStream; 
import java.util.ArrayList; 
import java.util.List; 
import org.apache.poi.hssf.usermodel.HSSFCell; 
import org.apache.poi.hssf.usermodel.HSSFRow; 
import org.apache.poi.hssf.usermodel.HSSFSheet; 
import org.apache.poi.hssf.usermodel.HSSFWorkbook; 
import org.ourpioneer.excel.bean.Student; 
/**
* POI读取Excel示例,分2003和2007

* @author Nanlei

*/ 
public class ReadExcel { 
    private static String xls2003 = "C:\\student.xls"; 
    private static String xlsx2007 = "C:\\student.xlsx"; 
    /**
     * 读取Excel2003的示例方法
     * 
     * @param filePath
     * @return
     */ 
private static List<Student> readFromXLS2003(String filePath) { 
        File excelFile = null;// Excel文件对象 
        InputStream is = null;// 输入流对象 
        String cellStr = null;// 单元格,最终按字符串处理 
        List<Student> studentList = new ArrayList<Student>();// 返回封装数据的List 
        Student student = null;// 每一个学生信息对象 
try { 
            excelFile = new File(filePath); 
            is = new FileInputStream(excelFile);// 获取文件输入流 
            HSSFWorkbook workbook2003 = new HSSFWorkbook(is);// 创建Excel2003文件对象 
            HSSFSheet sheet = workbook2003.getSheetAt(0);// 取出第一个工作表,索引是0 
            // 开始循环遍历行,表头不处理,从1开始 
            for (int i = 1; i <= sheet.getLastRowNum(); i++) { 
                student = new Student();// 实例化Student对象 
                HSSFRow row = sheet.getRow(i);// 获取行对象 
                if (row == null) {// 如果为空,不处理 
                    continue; 
                } 
// 循环遍历单元格 
                for (int j = 0; j < row.getLastCellNum(); j++) { 
                    HSSFCell cell = row.getCell(j);// 获取单元格对象 
                    if (cell == null) {// 单元格为空设置cellStr为空串 
                        cellStr = ""; 
                    } else if (cell.getCellType() == HSSFCell.CELL_TYPE_BOOLEAN) {// 对布尔值的处理 
                        cellStr = String.valueOf(cell.getBooleanCellValue()); 
                    } else if (cell.getCellType() == HSSFCell.CELL_TYPE_NUMERIC) {// 对数字值的处理 
                        cellStr = cell.getNumericCellValue() + ""; 
                    } else {// 其余按照字符串处理 
                        cellStr = cell.getStringCellValue(); 
                    } 
// 下面按照数据出现位置封装到bean中 
                    if (j == 0) { 
                        student.setName(cellStr); 
                    } else if (j == 1) { 
                        student.setGender(cellStr); 
                    } else if (j == 2) { 
                        student.setAge(new Double(cellStr).intValue()); 
                    } else if (j == 3) { 
                        student.setSclass(cellStr); 
                    } else { 
                        student.setScore(new Double(cellStr).intValue()); 
                    } 
                } 
                studentList.add(student);// 数据装入List 
            } 
} catch (IOException e) { 
            e.printStackTrace(); 
        } finally {// 关闭文件流 
            if (is != null) { 
                try { 
                    is.close(); 
                } catch (IOException e) { 
                    e.printStackTrace(); 
                } 
            } 
        } 
        return studentList; 
    } 
/**
     * 主函数
     * 
     * @param args
     */ 
    public static void main(String[] args) { 
        long start = System.currentTimeMillis(); 
        List<Student> list = readFromXLS2003(xls2003); 
        for (Student student : list) { 
            System.out.println(student); 
        } 
        long end = System.currentTimeMillis(); 
        System.out.println((end - start) + " ms done!"); 
    } 


    做几点说明,如果不处理表头,那么就从准备处理的行开始,而整个sheet对行的索引是从0开始的,而Excel中是1,这点和数组/集合类似。对于单元格中的数字,默认按double类型处理,所以只能字符串转double,再取出int值。最后执行主函数,得到如下内容:

    这样就拿到对象的List了,之后要持久到数据库或者直接做业务逻辑就随心所欲了。下面来看2007的处理,处理流程和2003是类似的,区别就是使用的对象,2003中对象是HSSF*格式的,而2007是XSSF*格式的。方法如下:
Java代码
public static List<Student> readFromXLSX2007(String filePath) { 
        File excelFile = null;// Excel文件对象 
        InputStream is = null;// 输入流对象 
        String cellStr = null;// 单元格,最终按字符串处理 
        List<Student> studentList = new ArrayList<Student>();// 返回封装数据的List 
        Student student = null;// 每一个学生信息对象 
        try { 
            excelFile = new File(filePath); 
            is = new FileInputStream(excelFile);// 获取文件输入流 
            XSSFWorkbook workbook2007 = new XSSFWorkbook(is);// 创建Excel2003文件对象 
            XSSFSheet sheet = workbook2007.getSheetAt(0);// 取出第一个工作表,索引是0 
            // 开始循环遍历行,表头不处理,从1开始 
            for (int i = 1; i <= sheet.getLastRowNum(); i++) { 
                student = new Student();// 实例化Student对象 
                XSSFRow row = sheet.getRow(i);// 获取行对象 
                if (row == null) {// 如果为空,不处理 
                    continue; 
                } 
                // 循环遍历单元格 
                for (int j = 0; j < row.getLastCellNum(); j++) { 
                    XSSFCell cell = row.getCell(j);// 获取单元格对象 
                    if (cell == null) {// 单元格为空设置cellStr为空串 
                        cellStr = ""; 
                    } else if (cell.getCellType() == HSSFCell.CELL_TYPE_BOOLEAN) {// 对布尔值的处理 
                        cellStr = String.valueOf(cell.getBooleanCellValue()); 
                    } else if (cell.getCellType() == HSSFCell.CELL_TYPE_NUMERIC) {// 对数字值的处理 
                        cellStr = cell.getNumericCellValue() + ""; 
                    } else {// 其余按照字符串处理 
                        cellStr = cell.getStringCellValue(); 
                    } 
                    // 下面按照数据出现位置封装到bean中 
                    if (j == 0) { 
                        student.setName(cellStr); 
                    } else if (j == 1) { 
                        student.setGender(cellStr); 
                    } else if (j == 2) { 
                        student.setAge(new Double(cellStr).intValue()); 
                    } else if (j == 3) { 
                        student.setSclass(cellStr); 
                    } else { 
                        student.setScore(new Double(cellStr).intValue()); 
                    } 
                } 
                studentList.add(student);// 数据装入List 
            } 
        } catch (IOException e) { 
            e.printStackTrace(); 
        } finally {// 关闭文件流 
            if (is != null) { 
                try { 
                    is.close(); 
                } catch (IOException e) { 
                    e.printStackTrace(); 
                } 
            } 
        } 
        return studentList; 
    } 

    再次运行主函数,我们得到如下输出:

    可以看出,对2007的处理时间明显增长,还是2003版本效率更好,不过在使用Office组件时2007更便捷,而处理2003的程序效率更好。如何使用二者?根据程序业务来综合决定,看看牺牲掉哪部分。
    下面来做简单的文件写入,也就是准备输入写入Excel文件,为了演示,直接创建对象,而实际应用中数据可以是来自数据库的。写入文件就是文件解析的逆过程。但POI的组件不是从单元格开始创建文件的,还是从工作簿开始创建,进而创建工作表,行和单元格,最终将整个工作簿写入文件,完成操作。我们来看具体写法。
Java代码
package org.ourpioneer.excel; 
import java.io.File; 
import java.io.FileOutputStream; 
import java.util.ArrayList; 
import java.util.Arrays; 
import java.util.List; 
import org.apache.poi.hssf.usermodel.HSSFCell; 
import org.apache.poi.hssf.usermodel.HSSFRow; 
import org.apache.poi.hssf.usermodel.HSSFSheet; 
import org.apache.poi.hssf.usermodel.HSSFWorkbook; 
import org.ourpioneer.excel.bean.Student; 
/**
* 生成Excel示例,2003和2007

* @author Nanlei

*/ 
public class GenerateExcel { 
    private static String xls2003 = "C:\\student.xls"; 
    private static String xlsx2007 = "C:\\student.xlsx"; 
    private static List<Student> studentList = null; 
    private static Student[] students = new Student[4]; 
    /**
     * 静态块初始化数据
     */ 
    static { 
        studentList = new ArrayList<Student>(); 
        students[0] = new Student("张三", "男", 23, "一班", 94); 
        students[1] = new Student("李四", "女", 20, "一班", 92); 
        students[2] = new Student("王五", "男", 21, "一班", 87); 
        students[3] = new Student("赵六", "女", 22, "一班", 83); 
        studentList.addAll(Arrays.asList(students)); 
    } 
    /**
     * 创建2003文件的方法
     * 
     * @param filePath
     */ 
    public static void generateExcel2003(String filePath) { 
        // 先创建工作簿对象 
        HSSFWorkbook workbook2003 = new HSSFWorkbook(); 
        // 创建工作表对象并命名 
        HSSFSheet sheet = workbook2003.createSheet("学生信息统计表"); 
        // 遍历集合对象创建行和单元格 
        for (int i = 0; i < studentList.size(); i++) { 
            // 取出Student对象 
            Student student = studentList.get(i); 
            // 创建行 
            HSSFRow row = sheet.createRow(i); 
            // 开始创建单元格并赋值 
            HSSFCell nameCell = row.createCell(0); 
            nameCell.setCellValue(student.getName()); 
            HSSFCell genderCell = row.createCell(1); 
            genderCell.setCellValue(student.getGender()); 
            HSSFCell ageCell = row.createCell(2); 
            ageCell.setCellValue(student.getAge()); 
            HSSFCell sclassCell = row.createCell(3); 
            sclassCell.setCellValue(student.getSclass()); 
            HSSFCell scoreCell = row.createCell(4); 
            scoreCell.setCellValue(student.getScore()); 
        } 
        // 生成文件 
        File file = new File(filePath); 
        FileOutputStream fos = null; 
        try { 
            fos = new FileOutputStream(file); 
            workbook2003.write(fos); 
        } catch (Exception e) { 
            e.printStackTrace(); 
        } finally { 
            if (fos != null) { 
                try { 
                    fos.close(); 
                } catch (Exception e) { 
                    e.printStackTrace(); 
                } 
            } 
        } 
    } 
    /**
     * 主函数
     * 
     * @param args
     */ 
    public static void main(String[] args) { 
        long start = System.currentTimeMillis(); 
        generateExcel2003(xls2003); 
        long end = System.currentTimeMillis(); 
        System.out.println((end - start) + " ms done!"); 
    } 


    这样就生成了2003版Excel文件,只是最简单的操作,并没有涉及到单元格格式等操作,而2007的方法就是改改对象的名称,很简单,这里不再贴出了。
分享到:
评论

相关推荐

    Apache POI组件操作Excel,制作报表(四)

    这篇博文将深入探讨如何使用Apache POI组件来创建、修改和读取Excel文件,以实现报表制作。Apache POI提供了HSSF(Horizontally Stored Sheets Format)用于处理.xls格式的旧版Excel文件,以及XSSF(XML Spreadsheet...

    Apache POI组件操作Excel,制作报表(三)

    在本篇博文中,我们将聚焦于如何使用Apache POI组件来操作Excel,制作报表。这一部分是系列教程的第三部分,前两部分可能涉及了基础的读写操作和数据处理,而本部分则会深入到更复杂的报表制作技巧。 首先,Apache ...

    poi全家桶ooxml-schemas/poi/poi-examples/poi-ooxml/poi-ooxml-schemas/poi-scratchpad

    标题中的"poi全家桶ooxml-schemas/poi/poi-examples/poi-ooxml/poi-ooxml-schemas/poi-scratchpad"提及的是Apache POI项目中的多个关键组件和目录结构。Apache POI是一个开源的Java库,专门用于读写Microsoft Office...

    Apache poi 操作 excel 文件压缩包

    Apache POI 是一个开源项目,专门用于处理Microsoft Office格式的文件,包括Excel。在Java环境中,Apache POI 提供了一套API,使得开发者能够创建、修改和读取Excel文件。这个压缩包包含了Apache POI库的多个版本...

    poi-3.9 apache-poi-3.9 最新稳定版本

    Apache POI 是一个开源项目,由Apache软件基金会维护,它主要致力于处理Microsoft Office格式的文件,如Excel(.xlsx, .xls),Word(.doc, .docx)和PowerPoint(.ppt, .pptx)。POI库为Java开发者提供了一套API,...

    poi-3.9、poi-ooxml-3.9、poi-ooxml-schemas-3.9

    标题提到的"poi-3.9、poi-ooxml-3.9、poi-ooxml-schemas-3.9"是Apache POI的不同组件或版本,它们在生成和操作Excel文件时起着关键作用。 1. poi-3.9.jar:这是Apache POI的主要库,包含了处理老版Microsoft Office...

    poi的所有jar包,poi, poi-ooxml,poi-ooxml-schemas的各个版本jar

    在JavaWeb开发中,Apache POI常被用来处理服务器端的Excel文件操作,例如生成报表、导入导出数据或者进行自动化测试。通过这些jar包,开发者可以方便地读取Excel数据,将其与数据库交互,或者根据需求动态生成复杂的...

    poi-3.16.jar,poi-ooxml-3.16.jar,poi-ooxml-schemas-3.16.jar

    Apache POI 是一个开源项目,专门用于处理Microsoft Office格式的文件,如Excel、Word和PowerPoint。在Java环境中,POI 提供了丰富的API,使得开发者可以方便地创建、读取和修改这些文件。这里提到的三个jar文件是...

    poi-3.10.1上传组件jar包 po poi-ooxml poi-ooxml-schemas

    Apache POI 是一个开源项目,专门用于处理微软的Office文档格式,如Excel、Word和PowerPoint。这个"poi-3.10.1上传组件jar包"包含了处理这些文档所需的Java库,使得开发者可以在Java应用中创建、读取和修改Office...

    Apache Poi Excel导出

    这篇博客“Apache Poi Excel导出”可能详细介绍了如何使用Apache POI库来生成Excel文件,特别适用于数据导出或报表生成等场景。 Apache POI API 包含多个关键组件,如HSSF(Horizontally Stored Format)用于处理旧...

    应用POI组件读写Excel文档

    本文将深入探讨如何使用POI组件来处理Excel文档,包括创建、填充数据、读取信息以及在实际应用中的使用场景。 1. **POI组件介绍** Apache POI是一个开源项目,最初由Glen Stampoultzis创建,后来成为Apache软件...

    poi-3.8组件

    Apache POI 是一个开源项目,专门用于处理Microsoft Office格式的文件,如Word(.doc、.docx)、Excel(.xls、.xlsx)和PowerPoint(.ppt、.pptx)。这里的"poi-3.8组件"指的是Apache POI项目的3.8版本,这是一个...

    poi3.7和对应依赖jar包操作excel

    Apache POI 是一款开源的Java库,用于读写Microsoft Office格式的文件,特别是Excel(.xls和.xlsx)文件。在给定的资源中,我们有五个相关的jar包,包括两个版本的poi-3.7.jar,两个不同部分的OOXML支持(poi-ooxml-...

    poi3.14jar包

    Apache POI 是一个开源项目,专门用于处理微软的Office文档格式,如Excel、Word和PowerPoint。这个"poi3.14jar包"是Apache POI的3.14版本,是一个Java库,允许开发者在Java应用程序中创建、读取和修改Microsoft ...

    poi-bin-3.9-20121203附带poi使用说明文档

    Apache POI是一个强大的Java库,专门用于处理Microsoft Office格式的文件,如Excel、Word和PowerPoint。标题中的"poi-bin-3.9-20121203"指的是Apache POI项目的3.9版本的二进制发行版,发布于2012年12月3日。这个...

    poi3.0.1操作excel

    Apache POI 是一个开源项目,专门用于处理Microsoft Office格式的文件,如Excel、Word和PowerPoint。在本案例中,我们将重点关注"poi3.0.1"版本如何操作Excel文件。这个版本的POI库提供了Java程序员处理Excel文档的...

    POI报表导出excel

    Apache POI 是一个开源项目,专门用于处理 Microsoft Office 格式,尤其是 Excel 文件。在Java环境中,POI 提供了丰富的API,使得开发者能够轻松地读取、写入以及修改Excel文档。在这个“POI报表导出excel”的案例中...

    apache.poi-3.2

    Apache POI是一个流行的Java库,专门用于处理Microsoft Office格式的文件,如Word文档(.doc)、Excel电子表格(.xls)以及PowerPoint演示文稿(.ppt)。在标题"apache.poi-3.2"中提到的这个版本是Apache POI项目的...

    使用java Apache poi 根据word模板生成word报表.rar

    Apache POI是Java社区开发的一个库,主要用于读写Microsoft Office格式的文件,如Word(.doc/.docx)、Excel(.xls/.xlsx)等。在本项目中,“使用java Apache poi 根据word模板生成word报表.rar”是一个压缩包,...

    java 使用poi组件处理 excel word

    本文将深入探讨如何使用POI组件来处理Excel和Word文档,以及如何通过模板动态生成Excel表格。 一、Apache POI简介 Apache POI 是一个开源项目,它的主要功能是读取和写入Microsoft Office格式的文件,如.XLS(Excel...

Global site tag (gtag.js) - Google Analytics