`

POI处理Word、Excel、PowerPoint

    博客分类:
  • java
阅读更多

第一:下载POI,在http://jakarta.apache.org/poi/中,下载poi-bin-3.5-beta4-20081128.zip,解压后把jar包引入项目工程。

第二:处理Word(Word.java)


import org.apache.poi.hwpf.extractor.WordExtractor;

import java.io.File;

import java.io.InputStream;

 

public class Word {

    public static void main(String[] args) throws Exception {

       System.out.println(getContent("c:\\11.doc"));

    }

 

    public static String getContent(String s) throws Exception {

       return getContent(new java.io.FileInputStream(s));

    }

 

    public static String getContent(File f) throws Exception {

       return getContent(new java.io.FileInputStream(f));

    }

 

    public static String getContent(InputStream is) throws Exception {

       String bodyText = null;

       WordExtractor ex = new WordExtractor(is);

       bodyText = ex.getText();

       return bodyText;

    }

}

 
 


第三:处理Excel(Excel.java)


import org.apache.poi.hssf.usermodel.HSSFDateUtil;

import org.apache.poi.hssf.usermodel.HSSFWorkbook;

import org.apache.poi.hssf.usermodel.HSSFSheet;

import org.apache.poi.hssf.usermodel.HSSFRow;

import org.apache.poi.hssf.usermodel.HSSFCell;

import java.io.File;

import java.io.InputStream;

import java.text.SimpleDateFormat;

import java.util.Date;

 

public class Excel {

    public static void main(String[] args) throws Exception {

       System.out.println(getContent("c:\\22.xls"));

    }

 

    public static String getContent(String s) throws Exception {

       return getContent(new java.io.FileInputStream(s));

    }

 

    public static String getContent(File f) throws Exception {

       return getContent(new java.io.FileInputStream(f));

    }

 

    public static String getContent(InputStream is) throws Exception {

       StringBuffer content = new StringBuffer();

       HSSFWorkbook workbook = new HSSFWorkbook(is);

       for (int numSheets = 0; numSheets < workbook.getNumberOfSheets(); numSheets++) {

           HSSFSheet aSheet = workbook.getSheetAt(numSheets);// 获得一个sheet

           content.append("\n");

           if (null == aSheet) {

              continue;

           }

           for (int rowNum = 0; rowNum <= aSheet.getLastRowNum(); rowNum++) {

              content.append("\n");

              HSSFRow aRow = aSheet.getRow(rowNum);

              if (null == aRow) {

                  continue;

              }

              for (short cellNum = 0; cellNum <= aRow.getLastCellNum(); cellNum++) {

 

                  HSSFCell aCell = aRow.getCell(cellNum);

                  if (null == aCell) {

                     continue;

                  }

                  if (aCell.getCellType() == HSSFCell.CELL_TYPE_STRING) {

                     content.append(aCell.getRichStringCellValue()

                            .getString());

                  } else if (aCell.getCellType() == HSSFCell.CELL_TYPE_NUMERIC) {

                     boolean b = HSSFDateUtil.isCellDateFormatted(aCell);

                     if (b) {

                         Date date = aCell.getDateCellValue();

                         SimpleDateFormat df = new SimpleDateFormat(

                                "yyyy-MM-dd");

                         content.append(df.format(date));

                     }

                  }

              }

           }

       }

       return content.toString();

    }

}

 
 


第四:处理PowerPoint(PowerPoint.java)

import java.io.File;

import java.io.InputStream;

import org.apache.poi.hslf.HSLFSlideShow;

import org.apache.poi.hslf.model.TextRun;

import org.apache.poi.hslf.model.Slide;

import org.apache.poi.hslf.usermodel.SlideShow;

 

public class PowerPoint {

    public static void main(String[] args) throws Exception {

       System.out.println(getContent("c:\\33.ppt"));

    }

 

    public static String getContent(String s) throws Exception {

       return getContent(new java.io.FileInputStream(s));

    }

 

    public static String getContent(File f) throws Exception {

       return getContent(new java.io.FileInputStream(f));

    }

 

    public static String getContent(InputStream is) throws Exception {

       StringBuffer content = new StringBuffer("");

       SlideShow ss = new SlideShow(new HSLFSlideShow(is));

       Slide[] slides = ss.getSlides();

       for (int i = 0; i < slides.length; i++) {

           TextRun[] t = slides[i].getTextRuns();

           for (int j = 0; j < t.length; j++) {

              content.append(t[j].getText());

           }

           content.append(slides[i].getTitle());

       }

       return content.toString();

    }

}

 
 

 

本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/tim_zhang8888/archive/2009/02/07/3865980.aspx

分享到:
评论

相关推荐

    POI 读取 WORD EXCEL POWERPOINT 2003 2007

    Apache POI 是一个开源项目,专门用于处理 Microsoft Office 格式文档,如 Word、Excel 和 PowerPoint。这个项目为 Java 开发者提供了强大的 API,使得在没有安装 Microsoft Office 的情况下,也能进行读取、写入...

    利用POI读取excel写入到word

    在IT行业中,Apache POI是一个广泛使用的开源库,专门用于处理Microsoft Office格式的文件,如Excel、Word和PowerPoint。本篇文章将详细讲解如何利用Apache POI库来读取Excel数据并将其写入到Word文档中。 首先,...

    POI修改word、excel、pdf、ppt文件属性如作者以及将其转成html

    Apache POI是一个强大的Java库,专门用于处理Microsoft Office格式的文件,如Word(.doc, .docx)、Excel(.xls, .xlsx)、PowerPoint(.ppt, .pptx)等。通过使用POI,开发者可以创建、读取、修改这些文件,并且将...

    java POI完整示例,POI将word转HTML,数据库倒出数据到Excel等

    Java POI是一个强大的库,主要用于处理Microsoft Office格式的文件,如Word、Excel和PowerPoint。在本示例中,我们将探讨如何使用POI进行一系列操作,包括将Word文档转换为HTML,以及从数据库导出数据到Excel。 1. ...

    POI word目录处理备忘

    Apache POI是一个流行的开源Java库,它允许开发者读取、写入和修改Microsoft Office格式的文件,包括Word、Excel和PowerPoint。 Apache POI提供了API来处理Word文档中的目录结构,这在自动化文档生成、报告编写或者...

    poi 解析 office excel 2003,2007 word 2003,2007 的示例

    Apache POI 是一个开源项目,专门用于处理Microsoft Office格式的文件,包括Excel、Word和PowerPoint等。在Java环境中,Apache POI 提供了API,使得开发者能够方便地读取、写入和修改这些文件。本示例将详细介绍如何...

    poi解析excel、word2007,2010等版本

    Apache POI 是一款开源的Java库,专门用于处理Microsoft Office格式的文件,包括Excel、Word、PowerPoint等。本项目中的"poiTest"是一个Web应用示例,它演示了如何使用Apache POI来解析不同版本的Excel(如2007、...

    poi完美word转html

    POI-OOXML组件提供了对Office Open XML文件的支持,包括Word(.docx)、Excel(.xlsx)和PowerPoint(.pptx)。 二、POI将Word转换为HTML的原理: 在将Word文档转换为HTML时,Apache POI使用了WordToHtmlConverter...

    POI导出Word 页眉 页脚 标题设置

    Apache POI 是一个开源项目,专门用于处理Microsoft Office格式的文件,如Word、Excel和PowerPoint。在本主题中,我们将深入探讨如何使用POI库来导出Word文档,并进行页眉、页脚和标题的设置。这个过程涉及到对Word...

    Android上使用POI抽取WordExcel和PPT内容工程源码

    总之,“Android4Office”项目提供了一个基础框架,帮助开发者在Android环境中使用Apache POI库处理Word、Excel和PPT文件。通过深入理解上述知识点,开发者可以在此基础上进行扩展,实现更复杂的Office文档操作功能...

    [简单]poi读取word 2007简单文本框值

    Apache POI是一个流行的开源Java库,用于处理Microsoft Office格式的文件,如Word(.docx)、Excel(.xlsx)和PowerPoint(.pptx)。在Word 2007中,用户可以插入文本框来组织或装饰文本,而POI库提供了方法来访问和...

    poi将word、PPT、Excel转pdf实现在线预览的jar包

    标题中的“poi将word、PPT、Excel转pdf实现在线预览的jar包”涉及到的是Apache POI库在Java开发中的应用,以及如何利用它来处理Microsoft Office文档并转换为PDF格式,以便进行在线预览。Apache POI是Java平台上用于...

    使用poi替换word中的图片

    在IT领域,Apache POI是一个广泛使用的开源库,主要用于处理Microsoft Office格式的文件,如Word(.doc/.docx)、Excel(.xls/.xlsx)和PowerPoint(.ppt/.pptx)。本篇将深入探讨如何使用Apache POI库来替换Word...

    JAVA读取WORD_EXCEL_POWERPOINT_PDF文件的方法(poi)

    JAVA 读取 WORD_EXCEL_POWERPOINT_PDF 文件的方法(poi) JAVA 读取 WORD_EXCEL_POWERPOINT_PDF 文件的方法是使用 Apache POI 库来实现的。POI 库是一个开放源代码的 Java 库,提供了对 Microsoft Office 文件格式...

    利用poi+word模版书签,向word中插入数据

    在IT行业中,尤其是在文档自动化处理领域,Apache POI是一个非常重要的工具,它允许开发者使用Java来操作Microsoft Office格式的文件,如Word、Excel和PowerPoint。本教程将深入讲解如何利用Apache POI的XWPF模块...

    POI处理Excel文件.zip

    Apache POI是一个开源库,主要用于处理Microsoft Office格式的文件,如Excel、Word和PowerPoint。在Excel处理方面,POI提供了强大的API,使得开发者能够轻松地读取、写入和修改Excel文件。针对Excel 2007及以上版本...

    java_poi实现excel导入导出

    它提供了一系列的 API,用于处理 Microsoft Office 文件格式,包括 Excel、Word、PowerPoint 等。Java POI 的主要特点是可以在 Java 应用程序中读取、写入和操作 Office 文件。 2. Java POI 的组成 Java POI 由多...

    POI使用word模板文件循环输出行并导出word

    Apache POI是一个强大的Java库,专门用于处理Microsoft Office格式的文件,如Word、Excel和PowerPoint。在这个例子中,我们将探讨如何使用POI库来处理Word文档,特别是利用模板文件循环输出表格行并导出新的Word文档...

    POI操作Word中插入文本和图片

    Apache POI是一个强大的Java库,专门用于处理Microsoft Office格式的文件,如Word、Excel和PowerPoint。在本文中,我们将深入探讨如何使用Apache POI在Word文档中插入文本和图片,这对于创建动态报告模板尤其有用。 ...

    poi解析word文档 及 试卷数学公式导入wmf图片转成png图片

    Apache POI是Java中一个流行的库,它允许开发者读取、写入和修改Microsoft Office格式的文件,包括Word、Excel和PowerPoint。在本场景中,可能涉及读取Word文档中的文本、样式、表格、图像等元素,以便进行进一步的...

Global site tag (gtag.js) - Google Analytics