`

Apache POI (JAVA处理Office文档的类库)

    博客分类:
  • J2EE
 
阅读更多

Apache POI是Apache软件基金会的开放源码函式库,POI提供API给Java程序对Microsoft Office格式档案读和写的功能。
结构:

HSSF - 提供读写Microsoft Excel格式档案的功能。
XSSF - 提供读写Microsoft Excel OOXML格式档案的功能。
HWPF - 提供读写Microsoft Word格式档案的功能。
HSLF - 提供读写Microsoft PowerPoint格式档案的功能。
HDGF - 提供读写Microsoft Visio格式档案的功能。

创建Excel 文档
示例1将演示如何利用Jakarta POI API 创建Excel 文档。
示例1程序如下:

 

public class CreateXL {
/** Excel 文件要存放的位置,假定在D盘下*/
public static String outputFile="D:\\test.xls";
public static void main(String argv[]){
try{
// 创建新的Excel 工作簿
HSSFWorkbook workbook = new HSSFWorkbook();
// 在Excel工作簿中建一工作表,其名为缺省值
// 如要新建一名为"效益指标"的工作表,其语句为:
// HSSFSheet sheet = workbook.createSheet("效益指标");
HSSFSheet sheet = workbook.createSheet();
// 在索引0的位置创建行(最顶端的行)
HSSFRow row = sheet.createRow((short)0);
//在索引0的位置创建单元格(左上端)
HSSFCell cell = row.createCell((short) 0);
// 定义单元格为字符串类型
cell.setCellType(HSSFCell.CELL_TYPE_STRING);
// 在单元格中输入一些内容
cell.setCellValue("增加值");
// 新建一输出文件流
FileOutputStream fOut = new FileOutputStream(outputFile);
// 把相应的Excel 工作簿存盘
workbook.write(fOut);
fOut.flush();
// 操作结束,关闭文件
fOut.close();
System.out.println("文件生成...");
}catch(Exception e) {
System.out.println("已运行 xlCreate() : " + e );
}
}


读取Excel文档中的数据
示例2将演示如何读取Excel文档中的数据。假定在D盘JTest目录下有一个文件名为test1.xls的Excel文件。
示例2程序如下:

 

 

public class ReadXL {
/** Excel文件的存放位置。注意是正斜线*/
public static String fileToBeRead="D:\\test1.xls";
public static void main(String argv[]){
try{
// 创建对Excel工作簿文件的引用
HSSFWorkbook workbook = new HSSFWorkbook(new FileInputStream(fileToBeRead));
// 创建对工作表的引用。
// 本例是按名引用(让我们假定那张表有着缺省名"Sheet1")
HSSFSheet sheet = workbook.getSheet("Sheet1");
// 也可用getSheetAt(int index)按索引引用,
// 在Excel文档中,第一张工作表的缺省索引是0,
// 其语句为:HSSFSheet sheet = workbook.getSheetAt(0);
// 读取左上端单元
HSSFRow row = sheet.getRow(0);
HSSFCell cell = row.getCell((short)0);
// 输出单元内容,cell.getStringCellValue()就是取所在单元的值
System.out.println("左上端单元是: " + cell.getStringCellValue());
}catch(Exception e) {
System.out.println("已运行xlRead() : " + e );
}
}


详细使用方法见《Busy Developers' Guide to HSSF and XSSF Features》http://poi.apache.org/spreadsheet/quick-guide.html

 

处理WORD文档

 

public class TestPoi {
public TestPoi() {
}
public static void main(String args[]) throws Exception
{
FileInputStream in = new FileInputStream ("D:\\a.doc");
WordExtractor extractor = new WordExtractor();
String str = extractor.extractText(in);
//System.out.println("the result length is"+str.length());
System.out.println(str);
}
}



 

分享到:
评论

相关推荐

    Java控制office类库

    Java控制Office类库主要指的是Java开发者使用特定的API或库来操作Microsoft Office应用程序,如Word、Excel和PowerPoint,通常是为了自动化文档处理、数据导入导出或者报告生成等任务。在Java中,有两种常见的实现...

    org.apache.poi.hssf.converter,office转html所需包

    在这个标题为“org.apache.poi.hssf.converter,office转html所需包”的压缩包中,包含了将Office文档转换为HTML格式所需的Java类库。转换过程通常涉及到以下几个关键知识点: 1. **HSSF API**:这是Apache POI提供...

    java 使用POI合并两个word文档.docx

    1. 导入必要的类库,包括 java.io.FileInputStream、java.io.FileOutputStream、java.io.InputStream、java.io.OutputStream、org.apache.poi.openxml4j.opc.OPCPackage、org.apache.poi.xwpf.usermodel....

    java操作excel工作表类库和chm格式的帮助文档

    Apache POI是Java社区中最常用的一个用于处理Microsoft Office格式的库,它支持Excel(XLS和XLSX格式)。Apache POI提供了丰富的API,可以创建新的工作簿、工作表,插入单元格,设置样式,以及读取和修改现有Excel...

    apache poi

    Apache POI 提供了丰富的API,使得与Office文档交互变得简单且高效。 在Excel处理方面,Apache POI 使用HSSF(Horrible Spreadsheet Format)和XSSF(Extensible Spreadsheet Format)两个组件。HSSF是针对老版本的...

    java poi读取office03和office07jar包

    总之,Java POI是处理Office文档的强大工具,无论你是需要读取旧版的Office 03文件还是新版的Office 07文件,它都能提供全面的支持。只要正确导入所需的jar包,并按照API文档提供的示例编写代码,就能轻松实现文件的...

    POI生成Excel POI操作Excel POI读取Excel POI类库

    Apache POI是一个强大的Java库,专门用于处理Microsoft Office格式的文件,尤其是Excel。在这个场景中,我们关注的是如何使用POI来创建、读取和操作Excel文档。在Web项目中,这种功能通常用于数据导入导出,报表生成...

    poi-android

    标题“poi-android”指的是在Android平台上使用Apache POI库来处理Microsoft Office文档,特别是读取工作。Apache POI是一个开源项目,它允许开发者在Java环境中创建、修改和显示MS Office格式的文件,如Word(DOC, ...

    poi3.14jar包

    Apache POI 是一个开源项目,专门用于处理...总的来说,Apache POI 3.14版是一个强大的工具,帮助Java开发者与Microsoft Office文档格式进行无缝交互,无论是在数据处理、报表生成还是自动化任务中,都能发挥重要作用。

    Java利用poi对word插入文字图片

    首先,Apache POI提供了HWPF(Horrible Word Processor Format)和XWPF(XML Word Processor Format)两个类库,分别用于处理老版本的DOC文件和新版本的DOCX文件。在这个项目中,我们更可能使用XWPF,因为DOCX是更...

    java使用poi将word文档转为html

    Java中的Apache POI库是一个强大的工具,用于读取、创建和修改Microsoft Office格式的文件,包括Word(.doc和.docx)文档。在本案例中,我们关注的是如何使用POI将Word文档转换为HTML格式。这个过程对于在网络上展示...

    POI-java包

    总的来说,Apache POI是Java开发人员处理Microsoft Office文件的强大工具,其全面的功能和丰富的文档使得它在各种场景下都有广泛的应用。无论是读取现有的Office文件,还是生成新的文件,POI都能提供高效且灵活的...

    poi文件转换需要的jar包

    综上所述,Apache POI是Java处理Office文档的核心工具,但实现Office到PDF的转换需要结合其他库,如PDFBox或iText。在实际操作中,要关注兼容性、性能和样式保持,确保转换过程顺利且结果满足预期。

    org.apache.poi.xwpf.converter.pdf-1.0.6.rar

    Apache POI 是一个开源项目,专门用于处理微软的Office文档格式,如DOCX、XLSX和PPTX。在Java领域,它提供了一个强大的API,使得开发者能够方便地读取、创建、修改这些文件。而`org.apache.poi.xwpf.converter.pdf`...

    poi3.9打包

    "poi3.9打包"指的是这个版本的Apache POI的全套JAR包,它包含了处理不同Office文档类型所需的类库。 在Java应用中,Apache POI 3.9 版本是相当流行的一个选择,因为它兼容多种Office文件格式,并且稳定可靠。对于...

    org.apache.poi

    Oracle官方网站上提供的`org.apache.poi.jar`包正是这个项目的二进制发行版,包含了处理Office文档所需的所有Java类和方法。 在Java开发中,Apache POI 提供了一套完整的API,使得开发者可以方便地读取、写入和修改...

    poi相关jar包

    这个"poi相关jar包"就是包含了Apache POI库的Java类库,主要用于在Java应用程序中创建、读取和修改MS Office文档。在Java开发中,如果你需要与Excel进行交互,比如读取数据、写入数据或者进行复杂的数据分析,Apache...

    poi 所需全部jar包

    Apache POI 是一个开源项目,专门用于处理微软的Office文档格式,如Excel(.xlsx、.xls)、Word...这个“poi 所需全部jar包”包含了处理所有POI支持文档格式所需的类库,是Java开发人员进行Office文档操作的必备资源。

    java替换word中的变量

    本知识点将深入探讨如何使用Java实现这一功能,主要涉及的库是Apache POI,这是一个广泛使用的开源库,用于读写Microsoft Office格式的文件,包括Word(.doc和.docx)。 首先,Apache POI提供了HWPF(Horrible Word...

Global site tag (gtag.js) - Google Analytics