`
phipray
  • 浏览: 65799 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

纯Java实现对word的读写

阅读更多
import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import org.apache.poi.hwpf.extractor.WordExtractor;
import org.apache.poi.hwpf.model.io.HWPFOutputStream;



public class Word {
/**
* 读取纯文本的word文件
*/
public  String  readWord(String doc) throws Exception {
          String context = null;
          WordExtractor extractor = null; //纯文本的遍历器
         try {  
FileInputStream in = new FileInputStream(new File(doc));

             extractor = new WordExtractor(in);
    context = extractor.getText();
             } catch (Exception e) {  
        e.printStackTrace();  
    }  

    return context;
}

/**
* 对word文档做写操作
*
*/
public  boolean writeWord(String path, String content) throws Exception {
boolean w = false;  
    try {  
        byte b[] = content.getBytes(); 
        FileOutputStream fs = new FileOutputStream(path);
        HWPFOutputStream hos = new HWPFOutputStream();

        hos.write(b, 0, b.length);
        hos.writeTo(fs);
        hos.close();
                 w=true;
    } catch (Exception e) {  
        e.printStackTrace();  
    }  
 
    return w;  

}

public static void main(String[] args) {
ReadWord rw = new ReadWord();

        try{
         String text = rw.readDoc("D:\\workspace\\MyUntil\\t.doc");
         rw.writeDoc("D:\\workspace\\MyUntil\\d.doc", text);
           }catch(Exception e){
            e.printStackTrace();

           }

    }

}

所需的包请各位自己上apache的官网上poi工程目录下下吧
poi-3.5-final
poi-contrib-3.5-final
poi-ooxml-3.5-final
poi-scratchpad-3.5-final


我在本机跑过,能跑起来(如果你们跑不起,就留言吧)
能对word2003做读写操作,当然这个里的读只是读写都只做到对最简单的纯文本word.
在读word方面我能做到对word中图片和表的读取,不过是分开读,不能对同时含有文字,图片,表的word作为一个整体来读,就是说没办法处理文字,图片,表的相对位置
写方面我还没能把图片,表写到word里
希望如果有人知道怎么做的话,能留个言,让大家学习学习
分享到:
评论
2 楼 phipray 2012-02-16  
很久的时候写的,现在的api都改了很多,没试过啦,有时间我弄弄
1 楼 spp_1987 2012-02-07  
如果我把 word版本换成2010的 , 会跑起来嘛? 

相关推荐

    java 实现word文档的读写编辑

    本人编写的用java 实现对word文档的新建,打开,写入保存。需要包含poi外包实现。

    java 实现 word 文档的在线预览

    Apache POI是Java中处理Microsoft Office格式文件的一个流行库,它支持读写Word(.doc/.docx)文件。然而,POI并不直接支持将Word转换为HTML,因此可能需要借助其他工具或库来完成这个步骤。一种可能的方法是先用POI...

    java实现word预览打印

    4. **Java转Word**: 在Java中,可以使用如Apache POI这样的库来读写Word文档。Apache POI提供了一套API,使得开发者可以操作Word文件的各个部分,包括文本、样式、表格等。 5. **PDF转换**: 将Word文件转换为PDF是...

    java代码实现填充word模板生成word合同的实例

    本实例将探讨如何使用Java代码实现填充Word模板并生成Word合同。 首先,我们需要理解Apache POI库。Apache POI是Java平台上的一个开源项目,它允许Java应用程序读取、写入和修改Microsoft Office格式的文件,包括...

    java实现word模板的自动替换

    Java 实现Word模板的自动替换是一项常见的任务,...综上所述,Java实现Word模板的自动替换涉及到Java基础、Apache POI库的使用以及对Word文档结构的理解。通过熟练掌握这些知识,你可以创建高效且灵活的文档生成系统。

    poi实现对word读写操作源码

    本压缩包提供的"poi实现对word读写操作源码"包含了使用Apache POI进行Word文档处理的示例代码和必要的依赖库。 首先,让我们深入了解Apache POI的几个核心概念: 1. **HWPF(Horrible Word Processor Format)**:...

    java实现数据导入word代码

    首先,Java中实现数据导入Word通常会用到Apache POI库。Apache POI是一个开源项目,提供了API来读写Microsoft Office格式的文件,包括Word(.doc和.docx格式)。因此,你需要在项目中引入Apache POI的相关依赖。对于...

    java Apache poi 对word doc文件进行读写操作

    在实际应用中,Apache POI 的功能不仅限于简单的读写操作,还支持复杂的格式转换、样式调整和模板填充等功能,是 Java 开发者处理 Word 文件的强大工具。然而,需要注意的是,由于 `.doc` 文件格式的复杂性,处理...

    poi实现对word读写操作实例源码Java源码

    本实例将详细介绍如何利用Apache POI在Java中实现Word的读写功能。 首先,我们需要引入Apache POI的依赖库。通常,这可以通过在Maven或Gradle项目中添加相应的依赖来完成。对于Maven,可以在pom.xml文件中添加以下...

    Java操作word模板读写

    总的来说,Java操作Word模板读写是一个涉及文件I/O、XML解析和文档格式理解的综合任务,通过Apache POI等库,我们可以方便地实现这一目标。在实际开发中,根据需求选择合适的方法和工具,以提高效率和灵活性。

    java实现word中文转英文

    在Java编程环境中,实现Word文档中的中文到英文的转换是一项技术挑战,但通过利用特定的库和API,这个任务是可以完成的。以下是一篇详细解释如何实现这一目标的文章。 首先,我们需要选择一个能够处理Microsoft ...

    java实现word表格指定位置盖章,并且设置章悬浮于文字之上

    在Java开发中,实现Word表格指定位置盖章并设置...综上所述,Java通过Apache POI库可以实现Word表格指定位置盖章并且设置章悬浮于文字之上的功能,这需要对Word文档结构有深入理解,以及熟练运用Apache POI的相关API。

    java-poi完美读写word(doc/docx)和TXT。附jar包

    在这个主题中,我们将深入探讨如何使用Java POI库来实现Word(包括.doc和.docx)以及TXT文件的读写操作。 首先,让我们了解一下Java POI的工作原理。POI库提供了HSSF和XSSF两个API,分别用于处理旧版的二进制Excel...

    java操作Bfreemarker实现对word

    Java操作BFreeMarker实现对Word的操作是Java编程中一种常见的文本处理技术,它结合了BFreeMarker模板引擎和Apache POI库,用于生成或修改Word文档。BFreeMarker是一个用Java编写的开源模板语言,主要用于生成HTML、...

    JAVA实现Linux中word转换pdf

    Apache POI 是一个流行的Java库,用于读写Microsoft Office格式的文件,包括Word(.doc, .docx)。通过POI,你可以解析Word文档的内容,并将其提取出来。 3. **PDFBox或iText**: 要将Word内容转换为PDF,你需要...

    java实现HTML转Word

    Apache POI是Apache软件基金会的一个开源项目,主要用于读写Microsoft Office格式的文件,如Word(.doc/.docx)、Excel(.xls/.xlsx)等。在这个场景中,我们将主要关注它的Word处理能力。 首先,你需要在项目中...

    java实现word表格指定位置盖章,并且设置印章悬浮于文字之上

    在Java编程环境中,实现Word文档中的表格指定位置盖章,并让印章悬浮于文字之上,是一项技术挑战,但可以通过一些库和技巧来实现。这个过程主要涉及到对Word文档内容的读取、修改以及重新保存,同时要确保印章图像不...

    Java读写word文件

    Java读写Word文件是Java开发中的一个重要技能,尤其在处理文档自动化、数据报告生成等场景中。Java2Word库提供了一种有效的方式,使我们能够方便地在Java应用程序中创建和修改Microsoft Word文档,而避免了使用...

    JAVA读写word

    本教程将深入讲解如何使用Aspose库在Java环境中进行Word的读写操作。 1. **Aspose库介绍** Aspose是跨平台的文件处理组件集合,提供了对PDF、Excel、Word、PowerPoint等多种文件格式的支持。Aspose库为开发者提供...

    Java读写xml,word,xml文件(防乱码)

    ### Java读写XML、Word与TXT文件:去除乱码问题详解 #### 一、引言 在实际开发过程中,我们经常需要处理各种类型的文件,包括XML、Word文档以及普通的文本文件(如TXT)。这些文件在读写过程中经常会遇到乱码问题,...

Global site tag (gtag.js) - Google Analytics