`
xyliufeng
  • 浏览: 87212 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

POI提取word,读写excel

阅读更多
poi提取word:

import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;

import org.apache.poi.hwpf.extractor.WordExtractor;

public class TikaTest {

public static void main(String[] args) {
   File file = new File("E:\\expo_qa.doc");
   try {
    FileInputStream fis = new FileInputStream(file);
    WordExtractor wordExtractor = new WordExtractor(fis);
    System.out.println("使用getText()方法提取的Word文件的内容:");
    System.out.println("==============================");
    System.out.println(wordExtractor.getText());
    //System.out.println(wordExtractor.getFileSystem());
    
   } catch (FileNotFoundException e) {
    e.printStackTrace();
   } catch (IOException e) {
   e.printStackTrace();
}
}
} 


poi读写excel:

import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;

import org.apache.poi.hssf.usermodel.HSSFCell;
import org.apache.poi.hssf.usermodel.HSSFRow;
import org.apache.poi.hssf.usermodel.HSSFSheet;
import org.apache.poi.hssf.usermodel.HSSFWorkbook;
import org.apache.poi.poifs.filesystem.POIFSFileSystem;


public class TikaExcel {

	/**
	 * @param args
	 * @throws Exception 
	 * @throws FileNotFoundException 
	 */
	public static void main(String[] args) throws FileNotFoundException, Exception {
		// TODO Auto-generated method stub
		
		POIFSFileSystem fs = new POIFSFileSystem(new FileInputStream("E:/develop/staff.xls")); 
		HSSFWorkbook wb = new HSSFWorkbook(fs);
	
		 
         HSSFSheet sheet = wb.getSheetAt(0); 
         HSSFRow row = sheet.getRow(0); 
         HSSFCell cell = row.getCell((short)0); 
        String msg = cell.getStringCellValue(); 
       
        System.out.println(msg);
        HSSFRow row2 = sheet.getRow(1);
        System.out.println(row2.getCell(0)+" "+row2.getCell(1)+" "+row2.getCell(2)+" "+row2.getCell(3));
        HSSFRow row3 = sheet.getRow(11);
        System.out.println(row3.getCell(0)+" "+row3.getCell(1)+" "+row3.getCell(2)+" "+row3.getCell(3));
        
       // POIFSFileSystem fs =new POIFSFileSystem(new FileInputStream("workbook.xls")); 

        //HSSFWorkbook wb = new HSSFWorkbook(fs); 

       // HSSFSheet sheet = wb.getSheetAt(0); 

        HSSFRow rowX = sheet.getRow(11); 

        HSSFCell cellX = rowX.getCell((short)0); 

        cellX.setCellValue("李宁(James)"); 

        // Write the output to a file 

        FileOutputStream fileOut = new FileOutputStream("E:/develop/staff.xls"); 

        wb.write(fileOut); 

        fileOut.close(); 

	}

}

分享到:
评论

相关推荐

    poi3.1读写excel,wps et

    Apache POI是一个流行的开源库,专门用于处理Microsoft Office格式的文件,包括Excel(.xls和.xlsx)和Word(.doc和.docx)。在本场景中,我们关注的是使用POI 3.1版本来读取和写入Excel以及WPS的ET文件。POI 3.1是...

    基于poi实现word/excel转换为HTML(且兼容.doc.docx.xls.xlsx)

    Apache POI 是一个流行的开源库,专为处理Microsoft Office格式的文件,如Word(.doc/.docx)和Excel(.xls/.xlsx)。本教程将深入探讨如何使用Apache POI库来实现这些文件向HTML的转换,以实现跨平台和浏览器的兼容...

    java Apache poi 对word doc文件进行读写操作

    Apache POI 是一个流行的 Java 库,用于处理 Microsoft Office 格式,如 Word、Excel 和 PowerPoint。在处理 Word .doc 文件时,POI 提供了一个名为 HWPF(Horizontally Written Property Set Files)的模块。这个...

    Java读取Word中的表格(Excel),并导出文件为Excel

    这通常涉及到使用Apache POI库,一个强大的API,用于读写Microsoft Office格式的文件,包括Word(.docx)和Excel(.xlsx)。本篇文章将深入探讨如何使用Apache POI来实现这个功能。 首先,我们要了解Apache POI的...

    poi实现对word读写操作源码

    本压缩包提供的"poi实现对word读写操作源码"包含了使用Apache POI进行Word文档处理的示例代码和必要的依赖库。 首先,让我们深入了解Apache POI的几个核心概念: 1. **HWPF(Horrible Word Processor Format)**:...

    poi导入word和图片

    本文档将详细介绍如何使用 POI 库来读取 Word 文档(包括 .doc 和 .docx 格式)中的文本内容以及提取其中的图片。 #### 二、环境配置与依赖 为了能够顺利地执行示例代码,需要确保项目的 build 环境包含了以下依赖...

    java 利用POI读取Word文件中的内容

    如今,它已经成为处理Office文件格式的强大工具,支持读写Excel、Word和PowerPoint等多种文件。 在Java中,读取Word文档(.docx格式)主要使用XWPF(XML Word Processing)API。以下是使用POI读取Word文件的基本...

    JAVA读取WORD_EXCEL_POWERPOINT_PDF文件的方法(poi)

    JAVA 读取 WORD_EXCEL_POWERPOINT_PDF 文件的方法(poi) JAVA 读取 WORD_EXCEL_POWERPOINT_PDF 文件的方法是使用 ...使用 Apache POI 库可以轻松地读取 WORD_EXCEL_POWERPOINT_PDF 文件,并提取其中的文本内容。

    java中poi读写excel封装工具类(兼容office2003和2007等版本)

    Java中的Apache POI库是处理Microsoft Office文档的强大工具,尤其在读写Excel文件方面。它不仅支持旧版的Excel文件格式(.xls,用于Office 2003及更早版本),还支持新版本的Excel文件格式(.xlsx,自Office 2007起...

    Android上使用POI抽取WordExcel和PPT内容工程源码

    总之,“Android4Office”项目提供了一个基础框架,帮助开发者在Android环境中使用Apache POI库处理Word、Excel和PPT文件。通过深入理解上述知识点,开发者可以在此基础上进行扩展,实现更复杂的Office文档操作功能...

    java poi读取word

    Java POI 是一个开源库,专门用于处理Microsoft Office格式的文件,包括Word(.doc和.docx)、Excel(.xls和.xlsx)以及PowerPoint(.ppt和.pptx)。在这个场景中,我们关注的是如何使用Java POI来读取Word文档,并...

    java-poi完美读写word(doc/docx)和TXT。附jar包

    Java POI 是一个开源项目,专门用于处理微软的Office文档格式,如Word(.doc和.docx)、Excel和PowerPoint等。在这个主题中,我们将深入探讨如何使用Java POI库来实现Word(包括.doc和.docx)以及TXT文件的读写操作...

    java poi把word文档转化为html,支持doc。

    POI支持多种文件类型,如Excel(.xls和.xlsx)、Word(.doc和.docx)、PowerPoint(.ppt和.pptx)等。 2. **Word文档格式**: Word文档分为两种主要格式:.doc是早期的二进制格式,而.docx是基于XML的现代格式。尽管...

    利用POI将word转换成html实现在线阅读

    Apache POI是Java领域的一个强大工具,它支持Microsoft Office的文件格式读写,包括Word、Excel和PowerPoint等。 首先,让我们深入了解Apache POI库。POI项目始于2001年,其目标是创建一个纯Java实现的Microsoft ...

    java 读取word、excel及pdf的jar包(POI,PDFBox)

    Apache POI是一个流行的开源Java API,它允许开发者读写Microsoft Office格式的文件,包括HSSF(处理旧版的97-2003 .xls格式)和XSSF(处理较新的2007 .xlsx格式)对于Word文档,POI还提供了HWPF库来处理.doc文件。...

    使用POI来处理Excel和Word文件格式

    对于读取Excel文件,POI提供了相应的API来打开Workbook,遍历Sheets,Rows和Cells,提取所需的数据。 处理Word文件则相对复杂一些,因为HWPF目前的功能比HSSF少。开发者可以创建Document对象,添加Paragraph和Run,...

    利用poi+itextpdf进行word转pdf.rar

    Apache POI是一个流行的Java库,用于读写Microsoft Office格式的文件,包括Word(.doc和.docx)。它提供了低级API(HSSF和XSSF)处理Excel文件,以及HWPF和XWPF用于Word文档。在这个案例中,我们将主要关注XWPF,...

    使用poi完成的word操作.zip

    在IT行业中,Apache POI是一个广泛使用的开源库,专门用于处理Microsoft Office格式的文件,包括Word(.doc和.docx)、Excel(.xls和.xlsx)和PowerPoint(.ppt和.pptx)。在这个"使用poi完成的word操作.zip"文件中...

    java_poi_读写word文件doc文档_含所有依赖jar包_demo

    Java POI 是一个开源项目,专门用于处理微软的Office文件格式,如Excel、Word和PowerPoint。在本示例中,我们关注的是如何使用POI库来读写Microsoft Word(.doc)文档。这个"java_poi_读写word文件doc文档_含所有...

    poiWord2003和Word2007包括图片完整转换成html 包括完整Jar包

    1. **Apache POI基础**:Apache POI提供了HSSF和XSSF两个API,分别用于读写老版本的BIFF8格式(如Word2003的.doc文件)和新的OOXML格式(如Word2007的.docx文件)。HSSF对应于Excel,而XSSF则对应于Word和PowerPoint...

Global site tag (gtag.js) - Google Analytics