`
thtwin
  • 浏览: 165795 次
  • 性别: Icon_minigender_1
  • 来自: 成都
社区版块
存档分类
最新评论

使用Java将Word转为Html或txt等

    博客分类:
  • J2SE
阅读更多
前一段时间为这个问题头疼的不得了,后来查阅了资料终于解决了;现将程序放出,以便以后参考。


//------------------------------------------------------------------------------
//文件名称: wordtohtml           文件版本: 1.00.00
//作    者: 郭铸     作者邮箱: kookman1983@yahoo.com.cn 完成日期: 2004-10-20
//文件描述:
//其它描述:
//类 列 表:
//  wordtohtml: 将指定目录下面所有的doc文件转化为HTML并存储在相同目录下
//修改历史:
//  #   版本     修改日期    作者                 修改内容
//  ----------------------------------------------------------------------------
//  1   1.00.01  2004-10-14  作者姓名             修改内容描述
//  ----------------------------------------------------------------------------
//------------------------------------------------------------------------------
import com.jacob.com.*;
import com.jacob.activeX.*;
import java.io.*;

//取得指定目录下面所有的doc文件名称
public class wordtohtml
{
//------------------------------------------------------------------------------
//方法原型: change(String paths)
//功能描述: 将指定目录下面所有的doc文件转化为HTML并存储在相同目录下
//输入参数: String
//输出参数: 无
//返 回 值: 无
//其它说明: 递归
//------------------------------------------------------------------------------
public static void change(String paths, String savepaths)
{
  
  File d = new File(paths);
  //取得当前文件夹下所有文件和目录的列表
  File lists[] = d.listFiles();
  String pathss = new String("");

  //对当前目录下面所有文件进行检索
  for(int i = 0; i < lists.length; i ++)
  {
   if(lists[i].isFile())
   {
    String filename = lists[i].getName();
    String filetype = new String("");
    //取得文件类型
    filetype = filename.substring((filename.length() - 3), filename.length());
   
    //判断是否为doc文件
    if(filetype.equals("doc"))
    {
     System.out.println("当前正在转换......");
     //打印当前目录路径
     System.out.println(paths);
     //打印doc文件名
     System.out.println(filename.substring(0, (filename.length() - 4)));
    
     ActiveXComponent app = new ActiveXComponent("Word.Application");//启动word
    
     String docpath = paths + filename;
     String htmlpath = savepaths + filename.substring(0, (filename.length() - 4));
    
     String inFile = docpath;
    //要转换的word文件
     String tpFile = htmlpath;
    //HTML文件

     boolean flag = false;
    
     try
     {
      app.setProperty("Visible", new Variant(false));
        //设置word不可见
      Object docs = app.getProperty("Documents").toDispatch();
      Object doc = Dispatch.invoke(docs,"Open", Dispatch.Method, new Object[]{inFile,new Variant(false), new Variant(true)}, new int[1]).toDispatch();
        //打开word文件
      Dispatch.invoke(doc,"SaveAs", Dispatch.Method, new Object[]{tpFile,new Variant(8)}, new int[1]);
        //作为html格式保存到临时文件
      Variant f = new Variant(false);
      Dispatch.call(doc, "Close", f);
      flag = true;
     }
     catch (Exception e)
     {
      e.printStackTrace();
     }
     finally
     {
      app.invoke("Quit", new Variant[] {});
     }
     System.out.println("转化完毕!");
    }
   }
   else
   {
    pathss = paths;
    //进入下一级目录
    pathss = pathss + lists[i].getName() + "\\";   
    //递归遍历所有目录
    change(pathss, savepaths);
   }
  }
 
}
//------------------------------------------------------------------------------
//方法原型: main(String[] args)
//功能描述: main文件
//输入参数: 无
//输出参数: 无
//返 回 值: 无
//其它说明: 无
//------------------------------------------------------------------------------ 
public static void main(String[] args)
{
 
  String paths = new String("D:\\Work\\2004.10.8\\test system\\test01\\word\\");
  String savepaths = new String ("D:\\Work\\2004.10.8\\test system\\test01\\html\\");

  change(paths, savepaths);

}
}

其中import的jar包是一个开源的东东,网上搜索即得。
Dispatch.invoke(doc,"SaveAs", Dispatch.Method, new Object[]{tpFile,new Variant(8)}, new int[1]);
修改Variant(8)},里面得参数即可将Word转化为各种类型。



本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/guoxiaoshou2000/archive/2004/12/07/208024.aspx
分享到:
评论

相关推荐

    使用Java将Word转为Html或txt!

    在日常工作中,有时我们需要将Microsoft Word文档转换成其他格式,比如HTML或纯文本(TXT),以便于在网络环境中展示或者进行进一步的数据处理。Java作为一种广泛应用的编程语言,提供了多种工具和库来实现这种转换...

    Java程序把Word文档直接转换成Html文件

    Java程序把Word文档直接转换成Html文件是通过使用Java和COM组件实现的。COM组件是Windows操作系统中的一种组件对象模型,它允许不同的应用程序之间进行交互。在本文中,我们使用了Jacob库,它是一个Java和Windows下...

    通过java将word文档转换成html页面

    以下是一个详细的步骤,解释如何使用Java和JACOB将Word文档转换为HTML: 1. **环境配置**:首先,你需要在你的开发环境中安装JACOB库。这通常包括下载JACOB的jar文件,并将其添加到你的Java项目的类路径中。同时,...

    java html转换word

    将HTML转换为Word文档的需求在数据处理、报告生成或网页内容导出时经常出现。Apache POI是Java库,专门用于处理Microsoft Office格式的文件,如Word(.doc和.docx)、Excel(.xls和.xlsx)等。在这个小例子中,我们...

    java将html文件生成word文件

    本示例主要涉及的是将HTML文件转换为Word文档,具体使用的是Java库——docx4j。这个库提供了强大的功能,可以方便地进行XML、XSL-FO到OpenXML(包括.docx和.xlsx)的转换。下面我们将深入探讨这个过程。 首先,`...

    实现word文件转换成html文件实现在线打开预览word文件

    标题和描述中提到的"实现word文件转换成html文件实现在线打开预览word文件",这是一个关于将Microsoft Word文档转换为HTML格式,以便在网页上预览的技术问题。下面将详细介绍这个过程涉及的关键知识点。 1. **...

    java 将word 转化为html的方法

    转换过程涉及到解析Word文档的XML结构,并将其转换成HTML标签。 Java中一个常用的库是Apache POI,它是一个用于处理Microsoft Office格式文件的库,包括Word文档。Apache POI提供了一套API,允许开发者读取、写入和...

    使用java将office word pdf excel ppt文件转换成html文件

    本篇文章将深入探讨如何使用Java将Office Word、PDF、Excel和PPT文件转换为HTML文件。 首先,我们需要了解的是,Java中的文件转换通常依赖于第三方库,因为Java标准库并不直接支持这些特定的转换功能。以下是一些...

    基于java的word转html

    在本项目中,"基于java的word转html" 提供了一个工具,利用Java的强大力量将Microsoft Word文档(.doc和.docx格式)转换为HTML格式。这个转换过程能够保留原始Word文档中的各种元素,如图片、表格、链接以及目录,...

    java使用poi将word转为html

    java使用poi将word转为html

    java使用jacob将word,excel,ppt转成html

    Java 使用 Jacob 库将 Office 文件转换为 HTML 是一个常见的需求,尤其在自动化处理文档或在线预览场景中。Jacob(Java and COM Bridge)是一个 Java 库,它允许 Java 应用程序通过 COM(Component Object Model)...

    在线预览-java实现word和excel转html

    为了提供这种功能,开发者通常会使用各种库和工具,但本话题关注的是如何在不依赖外部套件的情况下,使用Java语言直接实现Word和Excel到HTML的转换,从而进行在线预览。 首先,我们要理解这个过程涉及到的主要技术...

    java POI完整示例,POI将word转HTML,数据库倒出数据到Excel等

    在这个示例中,我们可能利用POI的HWPF库来读取Word文档,然后将其内容转换成HTML格式。这在需要在网络上显示Word内容或者希望在网页上保持文档格式时非常有用。转换过程涉及解析Word文档的各个部分,如段落、表格和...

    java实现word转换成html实现word预览

    java实现word转换成html实现word预览

    java使用poi将word文档转为html

    在本案例中,我们关注的是如何使用POI将Word文档转换为HTML格式。这个过程对于在网络上展示内容或者进行数据迁移非常有用。 首先,我们需要理解Apache POI的基本概念。POI提供了HWPF(Horrible Word Processor ...

    poi将word转换成html、样式 表格 图片处理

    在本案例中,我们关注的是如何使用Apache POI将Word文档转换为HTML格式,并且保持原有的样式、表格和图片。下面我们将详细介绍这个过程中的关键知识点。 1. **Apache POI简介** Apache POI 提供了Java API,使得...

    java poi把word文档转化为html,支持doc。

    3. **转化过程**: 转换Word到HTML的过程通常涉及解析Word文档的内容,包括文本、样式、图片等,然后将这些元素重构为HTML标签。POI库提供API来访问Word文档的各个部分,如段落、表格、列表、图片等。 4. **使用步骤...

    java方式完整的word文件转html代码样例

    在Java编程环境中,将Word文档转换为HTML是一种常见的需求,特别是在数据处理、文档共享或网页展示等场景。本文将详细讲解如何使用Java实现这一功能,包括必要的库引用、代码示例以及转换过程。 首先,我们需要引入...

    java中html转word方法以及用到的jar包

    在Java开发中,有时我们需要将HTML内容转换成Word文档,以便于阅读、编辑或打印。这个过程涉及到HTML解析、格式转换以及可能的图像处理。在本文中,我们将深入探讨如何在Java中实现这一功能,以及需要用到的关键库和...

    利用POI将word转换成html实现在线阅读

    因此,需要将它们转换为PNG或JPEG等Web友好的格式。这可以通过使用图像转换库,如Apache Batik或第三方库wmf2png来完成。 4. **生成HTML代码**:将遍历得到的所有元素转换为HTML字符串,并组合成完整的HTML文件。这...

Global site tag (gtag.js) - Google Analytics