import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import org.apache.poi.hwpf.extractor.WordExtractor;
import org.apache.poi.hwpf.model.io.HWPFOutputStream;
public class Word {
/**
* 读取纯文本的word文件
*/
public String readWord(String doc) throws Exception {
String context = null;
WordExtractor extractor = null; //纯文本的遍历器
try {
FileInputStream in = new FileInputStream(new File(doc));
extractor = new WordExtractor(in);
context = extractor.getText();
} catch (Exception e) {
e.printStackTrace();
}
return context;
}
/**
* 对word文档做写操作
*
*/
public boolean writeWord(String path, String content) throws Exception {
boolean w = false;
try {
byte b[] = content.getBytes();
FileOutputStream fs = new FileOutputStream(path);
HWPFOutputStream hos = new HWPFOutputStream();
hos.write(b, 0, b.length);
hos.writeTo(fs);
hos.close();
w=true;
} catch (Exception e) {
e.printStackTrace();
}
return w;
}
public static void main(String[] args) {
ReadWord rw = new ReadWord();
try{
String text = rw.readDoc("D:\\workspace\\MyUntil\\t.doc");
rw.writeDoc("D:\\workspace\\MyUntil\\d.doc", text);
}catch(Exception e){
e.printStackTrace();
}
}
}
所需的包请各位自己上apache的官网上poi工程目录下下吧
poi-3.5-final
poi-contrib-3.5-final
poi-ooxml-3.5-final
poi-scratchpad-3.5-final
我在本机跑过,能跑起来(如果你们跑不起,就留言吧)
能对word2003做读写操作,当然这个里的读只是读写都只做到对最简单的纯文本word.
在读word方面我能做到对word中图片和表的读取,不过是分开读,不能对同时含有文字,图片,表的word作为一个整体来读,就是说没办法处理文字,图片,表的相对位置
写方面我还没能把图片,表写到word里
希望如果有人知道怎么做的话,能留个言,让大家学习学习
分享到:
相关推荐
本人编写的用java 实现对word文档的新建,打开,写入保存。需要包含poi外包实现。
Apache POI是Java中处理Microsoft Office格式文件的一个流行库,它支持读写Word(.doc/.docx)文件。然而,POI并不直接支持将Word转换为HTML,因此可能需要借助其他工具或库来完成这个步骤。一种可能的方法是先用POI...
4. **Java转Word**: 在Java中,可以使用如Apache POI这样的库来读写Word文档。Apache POI提供了一套API,使得开发者可以操作Word文件的各个部分,包括文本、样式、表格等。 5. **PDF转换**: 将Word文件转换为PDF是...
本实例将探讨如何使用Java代码实现填充Word模板并生成Word合同。 首先,我们需要理解Apache POI库。Apache POI是Java平台上的一个开源项目,它允许Java应用程序读取、写入和修改Microsoft Office格式的文件,包括...
Java 实现Word模板的自动替换是一项常见的任务,...综上所述,Java实现Word模板的自动替换涉及到Java基础、Apache POI库的使用以及对Word文档结构的理解。通过熟练掌握这些知识,你可以创建高效且灵活的文档生成系统。
本压缩包提供的"poi实现对word读写操作源码"包含了使用Apache POI进行Word文档处理的示例代码和必要的依赖库。 首先,让我们深入了解Apache POI的几个核心概念: 1. **HWPF(Horrible Word Processor Format)**:...
首先,Java中实现数据导入Word通常会用到Apache POI库。Apache POI是一个开源项目,提供了API来读写Microsoft Office格式的文件,包括Word(.doc和.docx格式)。因此,你需要在项目中引入Apache POI的相关依赖。对于...
在实际应用中,Apache POI 的功能不仅限于简单的读写操作,还支持复杂的格式转换、样式调整和模板填充等功能,是 Java 开发者处理 Word 文件的强大工具。然而,需要注意的是,由于 `.doc` 文件格式的复杂性,处理...
本实例将详细介绍如何利用Apache POI在Java中实现Word的读写功能。 首先,我们需要引入Apache POI的依赖库。通常,这可以通过在Maven或Gradle项目中添加相应的依赖来完成。对于Maven,可以在pom.xml文件中添加以下...
总的来说,Java操作Word模板读写是一个涉及文件I/O、XML解析和文档格式理解的综合任务,通过Apache POI等库,我们可以方便地实现这一目标。在实际开发中,根据需求选择合适的方法和工具,以提高效率和灵活性。
在Java编程环境中,实现Word文档中的中文到英文的转换是一项技术挑战,但通过利用特定的库和API,这个任务是可以完成的。以下是一篇详细解释如何实现这一目标的文章。 首先,我们需要选择一个能够处理Microsoft ...
在Java开发中,实现Word表格指定位置盖章并设置...综上所述,Java通过Apache POI库可以实现Word表格指定位置盖章并且设置章悬浮于文字之上的功能,这需要对Word文档结构有深入理解,以及熟练运用Apache POI的相关API。
在这个主题中,我们将深入探讨如何使用Java POI库来实现Word(包括.doc和.docx)以及TXT文件的读写操作。 首先,让我们了解一下Java POI的工作原理。POI库提供了HSSF和XSSF两个API,分别用于处理旧版的二进制Excel...
Java操作BFreeMarker实现对Word的操作是Java编程中一种常见的文本处理技术,它结合了BFreeMarker模板引擎和Apache POI库,用于生成或修改Word文档。BFreeMarker是一个用Java编写的开源模板语言,主要用于生成HTML、...
Apache POI 是一个流行的Java库,用于读写Microsoft Office格式的文件,包括Word(.doc, .docx)。通过POI,你可以解析Word文档的内容,并将其提取出来。 3. **PDFBox或iText**: 要将Word内容转换为PDF,你需要...
Apache POI是Apache软件基金会的一个开源项目,主要用于读写Microsoft Office格式的文件,如Word(.doc/.docx)、Excel(.xls/.xlsx)等。在这个场景中,我们将主要关注它的Word处理能力。 首先,你需要在项目中...
在Java编程环境中,实现Word文档中的表格指定位置盖章,并让印章悬浮于文字之上,是一项技术挑战,但可以通过一些库和技巧来实现。这个过程主要涉及到对Word文档内容的读取、修改以及重新保存,同时要确保印章图像不...
Java读写Word文件是Java开发中的一个重要技能,尤其在处理文档自动化、数据报告生成等场景中。Java2Word库提供了一种有效的方式,使我们能够方便地在Java应用程序中创建和修改Microsoft Word文档,而避免了使用...
本教程将深入讲解如何使用Aspose库在Java环境中进行Word的读写操作。 1. **Aspose库介绍** Aspose是跨平台的文件处理组件集合,提供了对PDF、Excel、Word、PowerPoint等多种文件格式的支持。Aspose库为开发者提供...
### Java读写XML、Word与TXT文件:去除乱码问题详解 #### 一、引言 在实际开发过程中,我们经常需要处理各种类型的文件,包括XML、Word文档以及普通的文本文件(如TXT)。这些文件在读写过程中经常会遇到乱码问题,...