`
ancient_wind
  • 浏览: 40523 次
  • 性别: Icon_minigender_1
  • 来自: 成都
社区版块
存档分类
最新评论

java文档处理工具包——iText、apache poi

    博客分类:
  • JAVA
 
阅读更多

最近看了篇关于WEB报表工具的文章,里面提到了一些java工具包,在这里简单整理一下。


一、iText生成PDF

 

iText是用于生成pdf的一个java类库,可以将txt/html/xm/图片等生成pdf。

这里有一个实例,还比较详细http://www.blogjava.net/rosen/archive/2008/12/07/244858.html

 

二、apache poi读写MS Excel

 

Apache POI 是用Java编写的免费开源的跨平台的 Java API,Apache POI提供API给Java程式对Microsoft Office格式档案读和写的功能。

  Apache POI 是创建和维护操作各种符合Office Open XML(OOXML)标准和微软的OLE 2复合文档格式(OLE2)的Java API。用它可以使用Java读取和创建,修改MS Excel文件.而且,还可以使用Java读取和创建MS Word和MSPowerPoint文件。Apache POI 提供Java操作Excel解决方案(适用于Excel97-2008)。

 

核心API:

  HSSF - 提供读写Microsoft Excel XLS格式档案的功能。

  XSSF - 提供读写Microsoft Excel OOXML XLSX格式档案的功能。

  HWPF - 提供读写Microsoft Word DOC格式档案的功能。

  HSLF - 提供读写Microsoft PowerPoint格式档案的功能。

  HDGF - 提供读Microsoft Visio格式档案的功能。

  HPBF - 提供读Microsoft Publisher格式档案的功能。

 

  HSMF - 提供读Microsoft Outlook格式档案的功能。

 

代码示例:

创建Excel 文档

 

import org.apache.poi.hssf.usermodel.HSSFWorkbook;
  import org.apache.poi.hssf.usermodel.HSSFSheet;
  import org.apache.poi.hssf.usermodel.HSSFRow;
  import org.apache.poi.hssf.usermodel.HSSFCell;
  import javaioFileOutputStream;
  public class CreateXL {
  public static String outputFile="D:\\test.xls";
  public static void main(String argv[]){
  try{
  // 创建新的Excel 工作簿
  HSSFWorkbook workbook = new HSSFWorkbook();
  // 在Excel工作簿中建一工作表,其名为缺省值
  // 如要新建一名为"效益指标"的工作表,其语句为:
  // HSSFSheet sheet = workbook.createSheet("效益指标");
  HSSFSheet sheet = workbook.createSheet();
  // 在索引0的位置创建行(最顶端的行)
  HSSFRow row = sheet.createRow((short)0);
  //在索引0的位置创建单元格(左上端)
  HSSFCell cell = row.createCell((short) 0);
  // 定义单元格为字符串类型
  cell.setCellType(HSSFCell.CELL_TYPE_STRING);
  // 在单元格中输入一些内容
  cell.setCellValue("增加值");
  // 新建一输出文件流
  FileOutputStream fOut = new FileOutputStream(outputFile);
  // 把相应的Excel 工作簿存盘
  workbook.write(fOut);
  fOut.flush();
  // 操作结束,关闭文件
  fOut.close();
  System.out.println("文件生成...");
  }catch(Exception e) {
  System.out.println("已运行 xlCreate() : " + e );
  }
  }
  }

 读取Excel文档中的数据

 

import org.apache.poi.hssf.usermodel.HSSFWorkbook;
  import org.apache.poi.hssf.usermodel.HSSFSheet;
  import org.apache.poi.hssf.usermodel.HSSFRow;
  import org.apache.poi.hssf.usermodel.HSSFCell;
  import javaioFileOutputStream;
  public class ReadXL {
  public static String fileToBeRead="D:\\test1.xls";
  public static void main(String argv[]){
  try{
  // 创建对Excel工作簿文件的引用
  HSSFWorkbook workbook = new HSSFWorkbook(newFileInputStream(fileToBeRead));
  // 创建对工作表的引用。
  // 本例是按名引用(让我们假定那张表有着缺省名"Sheet1")
  HSSFSheet sheet = workbook.getSheet("Sheet1");
  // 也可用getSheetAt(int index)按索引引用,
  // 在Excel文档中,第一张工作表的缺省索引是0,
  // 其语句为:HSSFSheet sheet = workbook.getSheetAt(0);
  // 读取左上端单元
  HSSFRow row = sheet.getRow(0);
  HSSFCell cell = row.getCell((short)0);
  // 输出单元内容,cell.getStringCellValue()就是取所在单元的值
  System.out.println("左上端单元是: " + cell.getStringCellValue());
  }catch(Exception e) {
  System.out.println("已运行xlRead() : " + e );
  }
  }
  }

 设置单元格格式

  在这里,我们将只介绍一些和格式设置有关的语句,我们假定workbook就是对一个工作簿的引用。

在Java中,第一步要做的就是创建和设置字体和单元格的格式,然后再应用这些格式:  

1、创建字体,设置其为红色、粗体:  

HSSFFont font = workbook.createFont();  font.setColor(HSSFFont.COLOR_RED);  font.setBoldweight(HSSFFont.BOLDWEIGHT_BOLD);  

2、创建格式  

HSSFCellStyle cellStyle= workbook.createCellStyle();  cellStyle.setFont(font);  

3、应用格式  

HSSFCell cell = row.createCell((short) 0);  cell.setCellStyle(cellStyle);  cell.setCellType(HSSFCell.CELL_TYPE_STRING);

  cell.setCellValue("标题 "); 

处理WORD文档

 

 import javaio*;
  import org.textmining.text.extraction.WordExtractor;
  import org.apache.poi.hssf.usermodel.HSSFWorkbook;
  import org.apache.poi.hssf.usermodel.HSSFSheet;
  import org.apache.poi.hssf.usermodel.HSSFRow;
  import org.apache.poi.hssf.usermodel.HSSFCell;
  public class TestPoi {
  public TestPoi() {
  }
  public static void main(String args[]) throws Exception
  {
  FileInputStream in = new FileInputStream ("D:\\a.doc");
  WordExtractor extractor = new WordExtractor();
  String str = extractor.extractText(in);
  //System.out.println("the result length is"+str.length());
  System.out.println(str);
  }
  }

 参考:http://baike.baidu.com/view/3029809.htm

分享到:
评论

相关推荐

    使用ITEXT导出PDF、WORD,APACHE POI导出EXCEL报表文件

    通过学习和熟练掌握ITEXT和Apache POI,开发者可以提升工作效率,满足各种文档处理需求。 在提供的压缩包中,`code`目录可能包含了这些功能的示例代码,而`jar`文件可能是ITEXT和Apache POI的依赖库,确保了代码的...

    JAVA利用poi完成word转pdf,内容包括两个现成工具类和使用到的所有jar包

    为了完成这个任务,我们可以借助于其他的库,例如iText或Apache PDFBox,它们专门用于处理PDF文档。在这个特定的案例中,我们可能还需要一个名为Docx4j的库,它能够帮助我们从DOCX文档创建PDF。 1. **Apache POI**:...

    java+poi+word转pdf的简单demo,执行转换main方法不会抛异常

    Apache POI是一个流行的Java库,用于处理Microsoft Office格式的文件,包括Word(.doc/.docx)。在本示例中,我们将深入探讨如何使用Java和Apache POI库实现Word到PDF的转换,以及解决在转换过程中可能出现的依赖...

    java下,使用poi,itext将word转为pdf

    在Java开发环境中,将Word文档转换为PDF是常见的需求,特别是在处理报告、文档自动化或跨平台格式转换时。...Apache POI和iText是实现这一目标的常用工具,通过合理利用这两个库,可以有效地完成文档格式的转换。

    java itext生成多页的word模板

    Java中的iText库是一个强大的工具,用于生成和编辑PDF文档。在这个特定的场景中,我们关注的是如何使用iText来创建一个多页的Word模板。尽管iText主要支持PDF,但通过一些转换,它也能帮助创建复杂的Word文档。下面...

    使用poi根据模版生成word文档并转换成PDF文件

    常见的工具有iText、Apache PDFBox或者Java的第三方库如Aspose.Words。这里以Apache PDFBox为例,它提供了一个名为`PDDocument`的类来处理PDF文档。 - 读取Word文档:使用PDFBox的`PDFWriter`或`PDFImportPage`类,...

    Java中Excel转图片工具包(纯java)

    Apache POI是一个常用的Java库,可以用于处理Microsoft Office文档,包括Excel。通过Apache POI,我们可以读取Excel工作表,然后使用库中的方法将这些工作表写入PDF文件。 2. **PDF转图片**:完成Excel到PDF的转换...

    poi3.17所有jar包poi.hwpf.HWPFDocument,converter.PicturesManager

    在标题中提到的"poi3.17所有jar包",指的是Apache POI 3.17版本的库,其中包含了处理Word文档的关键类`poi.hwpf.HWPFDocument`和图片管理器`converter.PicturesManager`。`HWPFDocument`类用于读取和操作Word 97-...

    Java通过IText导出word和pdf所有jar

    对于Word文档的处理,Apache POI是Java操作Microsoft Office文档的主要工具: 1. **读写Word文档**:使用Apache POI的HWPF(Horrible Word Processor Format)模块,可以创建新的Word文档,读取和修改现有文档。 2. ...

    Itext导出Word文档的例子

    在IT行业中,生成和操作文档是一项常见的任务,而Itext是一个强大的开源库,主要用于处理PDF...这个例子展示了如何通过编程的方式灵活处理文档格式,这对于自动化办公流程或者在没有安装Office软件的环境中尤其有用。

    java通过itext生成word文件代码附itext-2.0.7.jar,iTextAsian.jar包

    如果你需要更高级的功能,可以考虑升级到`iText`的5.x或7.x版本,或者使用其他专门用于生成Word文件的库,如Apache POI。 总的来说,`iText`是一个强大的库,它使得在Java中生成Word文件变得简单。通过`iText-2.0.7...

    org.apache.poi.xwpf.converter.pdf-1.0.6.rar

    总结来说,`org.apache.poi.xwpf.converter.pdf-1.0.6.rar`包含的是一个Java库,用于将基于XML的Word文档转换为PDF格式,它利用了Apache POI和iText两个强大的工具。在实际开发中,这个库可以帮助你轻松地在Java应用...

    POI在线预览word和excel

    本代码demo是实现对word、excel、txt、pdf、jpg的在线预览功能,为了方便简单,使用的是servlet技术,jar包也在项目中,启动项目前需要参照PreviewServlet类进行配置,访问页面是preview.html

    java 通过使用itext 生成2003 word 文档(java生成word文档2)

    在Java编程中,生成Microsoft Word文档是一项常见的任务,特别是在企业级应用中,如报表生成、自动化文档处理等。本文将详细讲解如何使用iText库来创建2003格式的Word文档,即`.doc`文件。iText是一个流行的Java库,...

    java itext pdf word 中文 表格 图片

    Java中的iText库是一个强大的PDF处理工具,它允许开发者创建、编辑和操作PDF文档。在IT行业中,生成PDF和Word文档通常用于报告、发票、合同等文档的自动化生成,尤其在需要包含中文字符、表格和图片的情况下。iText...

    java导出文档需要的包

    对于Word文档,Java中广泛使用的库有Apache POI和Docx4j。Apache POI是一个开源项目,专门用于处理Microsoft Office格式,包括HSSF(处理.xls文件)和XSSF(处理.xlsx文件)。你可以使用`HWPFDocument`类来创建和...

    itext-2.0.8.jar

    在实际应用中,开发者通常会将iText与其他Java库结合使用,例如Apache POI(处理Microsoft Office格式)或Flying Saucer(HTML到PDF转换),来构建完整的文档处理解决方案。尽管如此,iText 2.0.8仍然是理解PDF生成...

    POI将文件转为html

    在IT行业中,尤其是在数据处理和文档管理领域,Apache POI是一个非常重要的库,它允许开发者使用Java处理Microsoft Office格式的文件,如Excel、Word和PowerPoint。本篇将详细讲解如何利用Apache POI将不同类型的...

    java word文档转PDF工具.zip

    这个工具包包含了必要的库文件(jar包)以及一个示例(demo),使得开发者可以直接将其集成到自己的Java项目中,方便快捷地进行格式转换。 首先,我们来看看Java在处理这种转换时的关键知识点: 1. **Apache POI**...

    java读取office文档demo

    - 对于Word文档,Java中常用的是Apache POI的HWPF库,用于处理`.doc`文件,而XWPF库则用于`.docx`文件。 - 开始时,会创建`HWPFDocument`或`XWPFDocument`对象来加载文件。然后,你可以遍历`Paragraph`和`Run`对象...

Global site tag (gtag.js) - Google Analytics