`
laies
  • 浏览: 243523 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

JAVA读写word文件

    博客分类:
  • Java
阅读更多

1。读取word文件有两种方法,用jacob包,可以修改生成word文件内容。如果只读取word里的文本内容的话,可以用poi读取word文件,先到http://www.ibiblio.org/maven2/org/textmining/tm-extractors/下载tm-extractors-0.4.jar包

2。读取word里的文本内容的示列代码

    import java.io.*;
    import org.textmining.text.extraction.WordExtractor;

    public class TestPoi {
    public TestPoi() {
    }
    public static void main(String args[]) throws Exception
    {
        try{
    FileInputStream in = new FileInputStream ("D:/szqxjzhbase/doc/修改后/2001-2005年/重大致灾暴雨/20050819-20/技术总结/2005年8月20日一次大暴雨过程低空急流脉动与强降水关系分析 .doc");
        //  FileInputStream in = new FileInputStream ("D:/szqxjzhbase/技术测试/新建 Microsoft Word 文档.doc");
    WordExtractor extractor = new WordExtractor();
    System.out.println(in.available());
    String str = extractor.extractText(in);
//    System.out.println("the result length is"+str.length());
    System.out.println(str);
        }catch(Exception e){
        e.printStackTrace();
    }
    }
    }

3。问题:有时候有图片读的时候会报个错,但在图片前面加个回车符号就好了,可能与这个包的内部机制有关

写文件后续……

分享到:
评论
2 楼 yjgyjg4 2008-09-08  
可以读取图片吗? 正在研究此问题,如果有资料或者例子请给我发一份,yjgyjg4@sina.com,谢谢
1 楼 myyate 2008-01-14  
楼主,写word文件的代码呢?

相关推荐

    Java读取Word文档页数

    在Java编程环境中,读取和处理Word文档通常涉及到使用第三方库,因为Java标准库并不直接支持Word文件的操作。本主题将深入探讨如何利用给定的`itextpdf-5.5.9.jar`和`jacob.jar`这两个库来实现Java读取Word文档页数...

    java读取word文档内容以及字体大小和颜色

    java读取不同版本文档的内容以及字体大小,实现对文档格式进行匹配!

    Java读取word文档内容并输出成网页(含图片,公式)

    在这个场景中,我们将重点讨论如何使用Java POI读取Word文档并将其内容转换为HTML网页,同时确保图片和公式等复杂元素能够正确显示。 首先,你需要在你的Java项目中引入Apache POI库。可以通过Maven或Gradle来添加...

    java读取word,pdf格式文档方法

    Java 读取 Word、PDF 格式文档方法 Java 是一种广泛应用的编程语言,对文档操作是其重要的应用场景之一。本文将介绍 Java 如何读取 Word、PDF 格式文档的几种方法。 使用 Jacob Jacob 是一个桥接工具,连接 Java ...

    java读取word文档.pdf

    首先,标题“java读取word文档.pdf”和描述“java读取word文档.pdf”暗示了文章内容可能涉及使用Java语言读取Word文档的技术。 从片段中可以提取到的关键技术点包括: 1. Apache POI库:Apache POI是一个开源的...

    java读取word文档

    ### Java读取Word文档知识点详解 #### 一、引言 在日常的软件开发工作中,处理办公文档(如Word)的需求十分常见。Java作为一种广泛使用的编程语言,提供了多种方式来读取Word文档中的内容,包括但不限于使用...

    Java读写word文件

    Java读写Word文件是Java开发中的一个重要技能,尤其在处理文档自动化、数据报告生成等场景中。Java2Word库提供了一种有效的方式,使我们能够方便地在Java应用程序中创建和修改Microsoft Word文档,而避免了使用...

    java实现读取word文件并且上传到数据库

    首先,为了读取Word文件,我们需要使用Java的一个库,如Apache POI。Apache POI是一个流行的开源项目,提供了API来处理Microsoft Office格式的文件,包括Word(.doc和.docx)文档。通过使用Apache POI,我们可以解析...

    java读取Word文档依赖jar包

    在本文中,我们将详细讨论如何使用Apache POI库来读取Word文档,以及在Java项目中如何添加和配置依赖。 首先,要使用Apache POI读取Word文档,你需要下载并引入相关的jar包。在给定的压缩包“poi读取word依赖包”中...

    java 利用POI读取Word文件中的内容

    本篇将详细介绍如何利用Apache POI库来读取Word文件中的内容。 首先,理解Apache POI的基本概念。POI是“Poor Obfuscation Implementation”的缩写,最初是为了反向工程微软的文件格式而创建的。如今,它已经成为...

    Java读取Word表格内容

    通过Java读取word表格中的内容,将内容存到数据库中,将Word中的图片存到硬盘中

    Java读取多Word文档中指定位置的表格数据或文本内容

    Java读取Word文档中指定位置(可以自己自定义位置)的表格数据或文本内容 * @param filePath 文档路径 * @param start 指定位置开始读取表格数据的该位置上的字符串 * @param end 指定位置开始结束读取表格数据的该...

    JAVA读取WORD_EXCEL_POWERPOINT_PDF文件的方法(poi)

    JAVA 读取 WORD_EXCEL_POWERPOINT_PDF 文件的方法(poi) JAVA 读取 WORD_EXCEL_POWERPOINT_PDF 文件的方法是使用 Apache POI 库来实现的。POI 库是一个开放源代码的 Java 库,提供了对 Microsoft Office 文件格式...

    java 实现 word 文档的在线预览

    转换过程中,我们需要一个能够读取Word文档并将其转化为HTML的库,例如Apache POI或Spire.Doc for Java。 Apache POI是Java中处理Microsoft Office格式文件的一个流行库,它支持读写Word(.doc/.docx)文件。然而,...

    Java读写xml,word,xml文件(防乱码)

    #### 五、Java读写Word文件 对于Word文档的读写,通常可以借助Apache POI组件来实现。但是,如果只需要简单的读写功能,而不想引入过多的依赖,也可以采用类似XML文件处理的方式来实现。需要注意的是,Word文档本身...

    java读取word2003

    在Java编程环境中,读取Word 2003文档是一项常见的任务,这通常涉及到处理`.doc`文件格式。为了实现这个功能,开发者可以利用各种库,如Apache POI或者JODConverter。Apache POI是一个流行的开源项目,它提供了对...

    java读取word文档.doc

    Java 读取 Word 文档是常见的需求,尤其是在自动化处理、数据导出或文档生成的场景中。本示例主要探讨如何使用 Java 处理 RTF(Rich Text Format)文档,而不是直接读取 .doc 或 .docx 文件。这是因为直接读取 Word ...

    java获取word文档的条目化内容

    java调用PageOffice在线编辑word文件的时候,获取word文档的条目化内容。 PageOffice V4.0 企业版试用序列号:Q37LN-W8NI-KFSQ-LEY3Y 部署步骤: 1. 拷贝simpledemo8文件夹到Tomcat的webapps目录下 2. 访问...

    Java读取Word中的表格(Excel),并导出文件为Excel

    2. **读取Word文档**: 使用Apache POI的`XWPFDocument`类来打开Word文档。你需要提供文件的输入流: ```java File wordFile = new File("path_to_word_file.docx"); FileInputStream fis = new FileInputStream...

Global site tag (gtag.js) - Google Analytics