`
senton
  • 浏览: 205831 次
  • 性别: Icon_minigender_1
  • 来自: 紫禁城
社区版块
存档分类
最新评论

使用Java将Word转为Html或txt!

    博客分类:
  • J2SE
阅读更多

package org.client;

// 使用Java将Word转为Html或txt!
import com.jacob.com.*;
import com.jacob.activeX.*;
import java.io.*;

public class Client {

 // 取得指定目录下面所有的doc文件名称
 // ------------------------------------------------------------------------------
 // 方法原型: change(String paths, String savepaths)
 // 功能描述: 将指定目录下面所有的doc文件转化为HTML并存储在相同目录下
 // 输入参数: String
 // 输出参数: 无
 // 返 回 值: 无
 // 其它说明: 递归
 // ------------------------------------------------------------------------------
 public static void change(String paths, String savepaths) {

  File d = new File(paths);
  // 取得当前文件夹下所有文件和目录的列表
  File lists[] = d.listFiles();
  String path = new String("");

  // 对当前目录下面所有文件进行检索
  for (int i = 0; i < lists.length; i++) {
   if (lists[i].isFile()) {
    String filename = lists[i].getName();
    String filetype = new String("");
    // 取得文件类型
    filetype = filename.substring((filename.length() - 3), filename
      .length());

    // 判断是否为doc文件
    if (filetype.equals("doc")) {
     System.out.println("当前正在转换......");
     // 打印当前目录路径
     System.out.println(paths);
     // 打印doc文件名
     System.out.println(filename.substring(0,
       (filename.length() - 4)));

     ActiveXComponent app = new ActiveXComponent(
       "Word.Application");// 启动word

     String docpath = paths + filename;
     String htmlpath = savepaths
       + filename.substring(0, (filename.length() - 4));

     String inFile = docpath;
     // 要转换的word文件
     String tpFile = htmlpath;
     // HTML文件

     try {
      app.setProperty("Visible", new Variant(false));
      // 设置word不可见
      Object docs = app.getProperty("Documents").toDispatch();
      Object doc = Dispatch.invoke(
        docs,
        "Open",
        Dispatch.Method,
        new Object[] { inFile, new Variant(false),
          new Variant(true) }, new int[1])
        .toDispatch();
      // 打开word文件
      Dispatch.invoke(doc, "SaveAs", Dispatch.Method,
        new Object[] { tpFile, new Variant(8) },
        new int[1]);
      // 作为html格式保存到临时文件
      Variant f = new Variant(false);
      Dispatch.call(doc, "Close", f);
     } catch (Exception e) {
      e.printStackTrace();
     } finally {
      app.invoke("Quit", new Variant[] {});
     }
     System.out.println("转化完毕!");
    }
   } else {
    path = paths;
    // 进入下一级目录
    path = path + lists[i].getName() + "\\";
    // 递归遍历所有目录
    change(path, savepaths);
   }
  }
 }

 // ------------------------------------------------------------------------------
 // 方法原型: main(String[] args)
 // 功能描述: main文件
 // 输入参数: 无
 // 输出参数: 无
 // 返 回 值: 无
 // 其它说明: 无
 // ------------------------------------------------------------------------------
 public static void main(String[] args) {
  String paths = new String("D:\\作业\\day54\\");
  String savepaths = new String("D:\\作业\\day54\\");
  change(paths, savepaths);
 }
 /*
  * 其中import的jar包是一个开源的东东,网上搜索即得。 Dispatch.invoke(doc, "SaveAs",
  * Dispatch.Method, new Object[]{tpFile,new Variant(8)}, new int[1]);
  * 修改Variant(8)},里面得参数即可将Word转化为各种类型。
  */

}
 

分享到:
评论

相关推荐

    java使用poi将word转为html

    java使用poi将word转为html

    java将html文件生成word文件

    本示例主要涉及的是将HTML文件转换为Word文档,具体使用的是Java库——docx4j。这个库提供了强大的功能,可以方便地进行XML、XSL-FO到OpenXML(包括.docx和.xlsx)的转换。下面我们将深入探讨这个过程。 首先,`...

    java html转换word

    将HTML转换为Word文档的需求在数据处理、报告生成或网页内容导出时经常出现。Apache POI是Java库,专门用于处理Microsoft Office格式的文件,如Word(.doc和.docx)、Excel(.xls和.xlsx)等。在这个小例子中,我们...

    Java程序把Word文档直接转换成Html文件

    Java程序把Word文档直接转换成Html文件是通过使用Java和COM组件实现的。COM组件是Windows操作系统中的一种组件对象模型,它允许不同的应用程序之间进行交互。在本文中,我们使用了Jacob库,它是一个Java和Windows下...

    通过java将word文档转换成html页面

    以下是一个详细的步骤,解释如何使用Java和JACOB将Word文档转换为HTML: 1. **环境配置**:首先,你需要在你的开发环境中安装JACOB库。这通常包括下载JACOB的jar文件,并将其添加到你的Java项目的类路径中。同时,...

    java使用poi将word文档转为html

    在本案例中,我们关注的是如何使用POI将Word文档转换为HTML格式。这个过程对于在网络上展示内容或者进行数据迁移非常有用。 首先,我们需要理解Apache POI的基本概念。POI提供了HWPF(Horrible Word Processor ...

    java将word转为html文件工具类

    java将.docx文件和.doc文件转为html文件的工具类。。。

    基于java的word转html

    在本项目中,"基于java的word转html" 提供了一个工具,利用Java的强大力量将Microsoft Word文档(.doc和.docx格式)转换为HTML格式。这个转换过程能够保留原始Word文档中的各种元素,如图片、表格、链接以及目录,...

    实现word文件转换成html文件实现在线打开预览word文件

    - Microsoft Office本身提供了将Word文档另存为HTML的功能,但这可能丢失某些复杂格式或样式。 - 开源库如Apache POI (Java) 和python-docx (Python) 可以读取Word文档,并允许开发者自定义转换过程。 - 第三方...

    java POI完整示例,POI将word转HTML,数据库倒出数据到Excel等

    2. **Java POI将Word转为HTML** 在这个示例中,我们可能利用POI的HWPF库来读取Word文档,然后将其内容转换成HTML格式。这在需要在网络上显示Word内容或者希望在网页上保持文档格式时非常有用。转换过程涉及解析Word...

    使用java将office word pdf excel ppt文件转换成html文件

    本篇文章将深入探讨如何使用Java将Office Word、PDF、Excel和PPT文件转换为HTML文件。 首先,我们需要了解的是,Java中的文件转换通常依赖于第三方库,因为Java标准库并不直接支持这些特定的转换功能。以下是一些...

    java poi把word文档转化为html,支持doc。

    - 加载Word文档:使用POI的`HWPFDocument`类(针对.doc文件)或`XWPFDocument`类(针对.docx文件)打开Word文档。 - 遍历文档内容:通过遍历文档的各个部分,如`Paragraph`、`Table`等,获取其文本和样式信息。 -...

    word转html java

    在Java开发中,有时我们需要将Microsoft Word文档转换为HTML格式,以便在网络上发布或者进行其他处理。这个过程可以通过Apache POI库来实现,该库允许Java程序员读取、创建和修改MS Office格式的文件,包括Word文档...

    word文档转成Html方案

    总之,这个"word文档转成Html方案"提供了一种使用Java实现Word到HTML转换的方法,适用于那些需要在富文本编辑器中展示或编辑Word内容的应用场景。通过理解并实施这个方案,开发者可以增强其应用程序的功能,提升用户...

    java将html转word并将图片打进word内,离线可看

    完整项目包括所有jar包,完美支持html转word,并解决图片断网不能访问的问题。调用HtmlToWord类测试即可,注意修改调用文件的路径,因里面用到jacob,需要将jacob.dll拷贝到项目所在jre\bin目录下面

    使用java将word文档转化为html格式.pdf

    3. **使用JACOB将Word转为HTML** - **核心代码**:在Java代码中,首先创建一个`ActiveXComponent`实例,代表Word应用程序。然后设置Word不可见,避免在转换过程中显示Word界面。 - **打开Word文档**:通过`...

    Java读取word文档内容并输出成网页(含图片,公式)

    在这个场景中,我们将重点讨论如何使用Java POI读取Word文档并将其内容转换为HTML网页,同时确保图片和公式等复杂元素能够正确显示。 首先,你需要在你的Java项目中引入Apache POI库。可以通过Maven或Gradle来添加...

    POI将文件转为html

    首先,我们从标题"POI将文件转为html"入手。Apache POI是Apache软件基金会的一个开源项目,提供了一套API用于读写Microsoft Office格式的文件。在转换过程中,POI能够解析这些文件的内部结构,并将其内容转化为HTML...

    poi将word转换成html、样式 表格 图片处理

    在本案例中,我们关注的是如何使用Apache POI将Word文档转换为HTML格式,并且保持原有的样式、表格和图片。下面我们将详细介绍这个过程中的关键知识点。 1. **Apache POI简介** Apache POI 提供了Java API,使得...

Global site tag (gtag.js) - Google Analytics