poi提取word:
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import org.apache.poi.hwpf.extractor.WordExtractor;
public class TikaTest {
public static void main(String[] args) {
File file = new File("E:\\expo_qa.doc");
try {
FileInputStream fis = new FileInputStream(file);
WordExtractor wordExtractor = new WordExtractor(fis);
System.out.println("使用getText()方法提取的Word文件的内容:");
System.out.println("==============================");
System.out.println(wordExtractor.getText());
//System.out.println(wordExtractor.getFileSystem());
} catch (FileNotFoundException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
}
}
poi读写excel:
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import org.apache.poi.hssf.usermodel.HSSFCell;
import org.apache.poi.hssf.usermodel.HSSFRow;
import org.apache.poi.hssf.usermodel.HSSFSheet;
import org.apache.poi.hssf.usermodel.HSSFWorkbook;
import org.apache.poi.poifs.filesystem.POIFSFileSystem;
public class TikaExcel {
/**
* @param args
* @throws Exception
* @throws FileNotFoundException
*/
public static void main(String[] args) throws FileNotFoundException, Exception {
// TODO Auto-generated method stub
POIFSFileSystem fs = new POIFSFileSystem(new FileInputStream("E:/develop/staff.xls"));
HSSFWorkbook wb = new HSSFWorkbook(fs);
HSSFSheet sheet = wb.getSheetAt(0);
HSSFRow row = sheet.getRow(0);
HSSFCell cell = row.getCell((short)0);
String msg = cell.getStringCellValue();
System.out.println(msg);
HSSFRow row2 = sheet.getRow(1);
System.out.println(row2.getCell(0)+" "+row2.getCell(1)+" "+row2.getCell(2)+" "+row2.getCell(3));
HSSFRow row3 = sheet.getRow(11);
System.out.println(row3.getCell(0)+" "+row3.getCell(1)+" "+row3.getCell(2)+" "+row3.getCell(3));
// POIFSFileSystem fs =new POIFSFileSystem(new FileInputStream("workbook.xls"));
//HSSFWorkbook wb = new HSSFWorkbook(fs);
// HSSFSheet sheet = wb.getSheetAt(0);
HSSFRow rowX = sheet.getRow(11);
HSSFCell cellX = rowX.getCell((short)0);
cellX.setCellValue("李宁(James)");
// Write the output to a file
FileOutputStream fileOut = new FileOutputStream("E:/develop/staff.xls");
wb.write(fileOut);
fileOut.close();
}
}
分享到:
相关推荐
Apache POI是一个流行的开源库,专门用于处理Microsoft Office格式的文件,包括Excel(.xls和.xlsx)和Word(.doc和.docx)。在本场景中,我们关注的是使用POI 3.1版本来读取和写入Excel以及WPS的ET文件。POI 3.1是...
Apache POI 是一个流行的开源库,专为处理Microsoft Office格式的文件,如Word(.doc/.docx)和Excel(.xls/.xlsx)。本教程将深入探讨如何使用Apache POI库来实现这些文件向HTML的转换,以实现跨平台和浏览器的兼容...
Apache POI 是一个流行的 Java 库,用于处理 Microsoft Office 格式,如 Word、Excel 和 PowerPoint。在处理 Word .doc 文件时,POI 提供了一个名为 HWPF(Horizontally Written Property Set Files)的模块。这个...
这通常涉及到使用Apache POI库,一个强大的API,用于读写Microsoft Office格式的文件,包括Word(.docx)和Excel(.xlsx)。本篇文章将深入探讨如何使用Apache POI来实现这个功能。 首先,我们要了解Apache POI的...
本压缩包提供的"poi实现对word读写操作源码"包含了使用Apache POI进行Word文档处理的示例代码和必要的依赖库。 首先,让我们深入了解Apache POI的几个核心概念: 1. **HWPF(Horrible Word Processor Format)**:...
本文档将详细介绍如何使用 POI 库来读取 Word 文档(包括 .doc 和 .docx 格式)中的文本内容以及提取其中的图片。 #### 二、环境配置与依赖 为了能够顺利地执行示例代码,需要确保项目的 build 环境包含了以下依赖...
如今,它已经成为处理Office文件格式的强大工具,支持读写Excel、Word和PowerPoint等多种文件。 在Java中,读取Word文档(.docx格式)主要使用XWPF(XML Word Processing)API。以下是使用POI读取Word文件的基本...
JAVA 读取 WORD_EXCEL_POWERPOINT_PDF 文件的方法(poi) JAVA 读取 WORD_EXCEL_POWERPOINT_PDF 文件的方法是使用 ...使用 Apache POI 库可以轻松地读取 WORD_EXCEL_POWERPOINT_PDF 文件,并提取其中的文本内容。
Java中的Apache POI库是处理Microsoft Office文档的强大工具,尤其在读写Excel文件方面。它不仅支持旧版的Excel文件格式(.xls,用于Office 2003及更早版本),还支持新版本的Excel文件格式(.xlsx,自Office 2007起...
总之,“Android4Office”项目提供了一个基础框架,帮助开发者在Android环境中使用Apache POI库处理Word、Excel和PPT文件。通过深入理解上述知识点,开发者可以在此基础上进行扩展,实现更复杂的Office文档操作功能...
Java POI 是一个开源库,专门用于处理Microsoft Office格式的文件,包括Word(.doc和.docx)、Excel(.xls和.xlsx)以及PowerPoint(.ppt和.pptx)。在这个场景中,我们关注的是如何使用Java POI来读取Word文档,并...
Java POI 是一个开源项目,专门用于处理微软的Office文档格式,如Word(.doc和.docx)、Excel和PowerPoint等。在这个主题中,我们将深入探讨如何使用Java POI库来实现Word(包括.doc和.docx)以及TXT文件的读写操作...
POI支持多种文件类型,如Excel(.xls和.xlsx)、Word(.doc和.docx)、PowerPoint(.ppt和.pptx)等。 2. **Word文档格式**: Word文档分为两种主要格式:.doc是早期的二进制格式,而.docx是基于XML的现代格式。尽管...
Apache POI是Java领域的一个强大工具,它支持Microsoft Office的文件格式读写,包括Word、Excel和PowerPoint等。 首先,让我们深入了解Apache POI库。POI项目始于2001年,其目标是创建一个纯Java实现的Microsoft ...
Apache POI是一个流行的开源Java API,它允许开发者读写Microsoft Office格式的文件,包括HSSF(处理旧版的97-2003 .xls格式)和XSSF(处理较新的2007 .xlsx格式)对于Word文档,POI还提供了HWPF库来处理.doc文件。...
对于读取Excel文件,POI提供了相应的API来打开Workbook,遍历Sheets,Rows和Cells,提取所需的数据。 处理Word文件则相对复杂一些,因为HWPF目前的功能比HSSF少。开发者可以创建Document对象,添加Paragraph和Run,...
Apache POI是一个流行的Java库,用于读写Microsoft Office格式的文件,包括Word(.doc和.docx)。它提供了低级API(HSSF和XSSF)处理Excel文件,以及HWPF和XWPF用于Word文档。在这个案例中,我们将主要关注XWPF,...
在IT行业中,Apache POI是一个广泛使用的开源库,专门用于处理Microsoft Office格式的文件,包括Word(.doc和.docx)、Excel(.xls和.xlsx)和PowerPoint(.ppt和.pptx)。在这个"使用poi完成的word操作.zip"文件中...
Java POI 是一个开源项目,专门用于处理微软的Office文件格式,如Excel、Word和PowerPoint。在本示例中,我们关注的是如何使用POI库来读写Microsoft Word(.doc)文档。这个"java_poi_读写word文件doc文档_含所有...
1. **Apache POI基础**:Apache POI提供了HSSF和XSSF两个API,分别用于读写老版本的BIFF8格式(如Word2003的.doc文件)和新的OOXML格式(如Word2007的.docx文件)。HSSF对应于Excel,而XSSF则对应于Word和PowerPoint...