Apache POI是Apache软件基金会的开放源码函式库,POI提供API给Java程序对Microsoft Office格式档案读和写的功能。
结构:
HSSF - 提供读写Microsoft Excel格式档案的功能。
XSSF - 提供读写Microsoft Excel OOXML格式档案的功能。
HWPF - 提供读写Microsoft Word格式档案的功能。
HSLF - 提供读写Microsoft PowerPoint格式档案的功能。
HDGF - 提供读写Microsoft Visio格式档案的功能。
创建Excel 文档
示例1将演示如何利用Jakarta POI API 创建Excel 文档。
示例1程序如下:
public class CreateXL { /** Excel 文件要存放的位置,假定在D盘下*/ public static String outputFile="D:\\test.xls"; public static void main(String argv[]){ try{ // 创建新的Excel 工作簿 HSSFWorkbook workbook = new HSSFWorkbook(); // 在Excel工作簿中建一工作表,其名为缺省值 // 如要新建一名为"效益指标"的工作表,其语句为: // HSSFSheet sheet = workbook.createSheet("效益指标"); HSSFSheet sheet = workbook.createSheet(); // 在索引0的位置创建行(最顶端的行) HSSFRow row = sheet.createRow((short)0); //在索引0的位置创建单元格(左上端) HSSFCell cell = row.createCell((short) 0); // 定义单元格为字符串类型 cell.setCellType(HSSFCell.CELL_TYPE_STRING); // 在单元格中输入一些内容 cell.setCellValue("增加值"); // 新建一输出文件流 FileOutputStream fOut = new FileOutputStream(outputFile); // 把相应的Excel 工作簿存盘 workbook.write(fOut); fOut.flush(); // 操作结束,关闭文件 fOut.close(); System.out.println("文件生成..."); }catch(Exception e) { System.out.println("已运行 xlCreate() : " + e ); } }
读取Excel文档中的数据
示例2将演示如何读取Excel文档中的数据。假定在D盘JTest目录下有一个文件名为test1.xls的Excel文件。
示例2程序如下:
public class ReadXL { /** Excel文件的存放位置。注意是正斜线*/ public static String fileToBeRead="D:\\test1.xls"; public static void main(String argv[]){ try{ // 创建对Excel工作簿文件的引用 HSSFWorkbook workbook = new HSSFWorkbook(new FileInputStream(fileToBeRead)); // 创建对工作表的引用。 // 本例是按名引用(让我们假定那张表有着缺省名"Sheet1") HSSFSheet sheet = workbook.getSheet("Sheet1"); // 也可用getSheetAt(int index)按索引引用, // 在Excel文档中,第一张工作表的缺省索引是0, // 其语句为:HSSFSheet sheet = workbook.getSheetAt(0); // 读取左上端单元 HSSFRow row = sheet.getRow(0); HSSFCell cell = row.getCell((short)0); // 输出单元内容,cell.getStringCellValue()就是取所在单元的值 System.out.println("左上端单元是: " + cell.getStringCellValue()); }catch(Exception e) { System.out.println("已运行xlRead() : " + e ); } }
详细使用方法见《Busy Developers' Guide to HSSF and XSSF Features》http://poi.apache.org/spreadsheet/quick-guide.html
处理WORD文档
public class TestPoi { public TestPoi() { } public static void main(String args[]) throws Exception { FileInputStream in = new FileInputStream ("D:\\a.doc"); WordExtractor extractor = new WordExtractor(); String str = extractor.extractText(in); //System.out.println("the result length is"+str.length()); System.out.println(str); } }
相关推荐
Java控制Office类库主要指的是Java开发者使用特定的API或库来操作Microsoft Office应用程序,如Word、Excel和PowerPoint,通常是为了自动化文档处理、数据导入导出或者报告生成等任务。在Java中,有两种常见的实现...
在这个标题为“org.apache.poi.hssf.converter,office转html所需包”的压缩包中,包含了将Office文档转换为HTML格式所需的Java类库。转换过程通常涉及到以下几个关键知识点: 1. **HSSF API**:这是Apache POI提供...
1. 导入必要的类库,包括 java.io.FileInputStream、java.io.FileOutputStream、java.io.InputStream、java.io.OutputStream、org.apache.poi.openxml4j.opc.OPCPackage、org.apache.poi.xwpf.usermodel....
Apache POI是Java社区中最常用的一个用于处理Microsoft Office格式的库,它支持Excel(XLS和XLSX格式)。Apache POI提供了丰富的API,可以创建新的工作簿、工作表,插入单元格,设置样式,以及读取和修改现有Excel...
Apache POI 提供了丰富的API,使得与Office文档交互变得简单且高效。 在Excel处理方面,Apache POI 使用HSSF(Horrible Spreadsheet Format)和XSSF(Extensible Spreadsheet Format)两个组件。HSSF是针对老版本的...
总之,Java POI是处理Office文档的强大工具,无论你是需要读取旧版的Office 03文件还是新版的Office 07文件,它都能提供全面的支持。只要正确导入所需的jar包,并按照API文档提供的示例编写代码,就能轻松实现文件的...
Apache POI是一个强大的Java库,专门用于处理Microsoft Office格式的文件,尤其是Excel。在这个场景中,我们关注的是如何使用POI来创建、读取和操作Excel文档。在Web项目中,这种功能通常用于数据导入导出,报表生成...
标题“poi-android”指的是在Android平台上使用Apache POI库来处理Microsoft Office文档,特别是读取工作。Apache POI是一个开源项目,它允许开发者在Java环境中创建、修改和显示MS Office格式的文件,如Word(DOC, ...
Apache POI 是一个开源项目,专门用于处理...总的来说,Apache POI 3.14版是一个强大的工具,帮助Java开发者与Microsoft Office文档格式进行无缝交互,无论是在数据处理、报表生成还是自动化任务中,都能发挥重要作用。
首先,Apache POI提供了HWPF(Horrible Word Processor Format)和XWPF(XML Word Processor Format)两个类库,分别用于处理老版本的DOC文件和新版本的DOCX文件。在这个项目中,我们更可能使用XWPF,因为DOCX是更...
Java中的Apache POI库是一个强大的工具,用于读取、创建和修改Microsoft Office格式的文件,包括Word(.doc和.docx)文档。在本案例中,我们关注的是如何使用POI将Word文档转换为HTML格式。这个过程对于在网络上展示...
总的来说,Apache POI是Java开发人员处理Microsoft Office文件的强大工具,其全面的功能和丰富的文档使得它在各种场景下都有广泛的应用。无论是读取现有的Office文件,还是生成新的文件,POI都能提供高效且灵活的...
综上所述,Apache POI是Java处理Office文档的核心工具,但实现Office到PDF的转换需要结合其他库,如PDFBox或iText。在实际操作中,要关注兼容性、性能和样式保持,确保转换过程顺利且结果满足预期。
Apache POI 是一个开源项目,专门用于处理微软的Office文档格式,如DOCX、XLSX和PPTX。在Java领域,它提供了一个强大的API,使得开发者能够方便地读取、创建、修改这些文件。而`org.apache.poi.xwpf.converter.pdf`...
"poi3.9打包"指的是这个版本的Apache POI的全套JAR包,它包含了处理不同Office文档类型所需的类库。 在Java应用中,Apache POI 3.9 版本是相当流行的一个选择,因为它兼容多种Office文件格式,并且稳定可靠。对于...
Oracle官方网站上提供的`org.apache.poi.jar`包正是这个项目的二进制发行版,包含了处理Office文档所需的所有Java类和方法。 在Java开发中,Apache POI 提供了一套完整的API,使得开发者可以方便地读取、写入和修改...
这个"poi相关jar包"就是包含了Apache POI库的Java类库,主要用于在Java应用程序中创建、读取和修改MS Office文档。在Java开发中,如果你需要与Excel进行交互,比如读取数据、写入数据或者进行复杂的数据分析,Apache...
Apache POI 是一个开源项目,专门用于处理微软的Office文档格式,如Excel(.xlsx、.xls)、Word...这个“poi 所需全部jar包”包含了处理所有POI支持文档格式所需的类库,是Java开发人员进行Office文档操作的必备资源。
本知识点将深入探讨如何使用Java实现这一功能,主要涉及的库是Apache POI,这是一个广泛使用的开源库,用于读写Microsoft Office格式的文件,包括Word(.doc和.docx)。 首先,Apache POI提供了HWPF(Horrible Word...