`
mmdev
  • 浏览: 13243098 次
  • 性别: Icon_minigender_1
  • 来自: 大连
文章分类
社区版块
存档分类
最新评论

使用Java将Word转为Html或txt等···

 
阅读更多
前一段时间为这个问题头疼的不得了,后来查阅了资料终于解决了;现将程序放出,以便以后参考。

//------------------------------------------------------------------------------
//版权所有 (C) 浪潮集团商用系统有限公司 保留所有权利
//文件名称: wordtohtml 文件版本: 1.00.00
//作 者: 郭铸 作者邮箱: guozhu@langchao.com 完成日期: 2004-10-20
//文件描述:
//其它描述:
//类 列 表:
// wordtohtml: 将指定目录下面所有的doc文件转化为HTML并存储在相同目录下
//修改历史:
// # 版本 修改日期 作者 修改内容
// ----------------------------------------------------------------------------
// 1 1.00.01 2004-10-14 作者姓名 修改内容描述
// ----------------------------------------------------------------------------
//------------------------------------------------------------------------------
import com.jacob.com.*;
import com.jacob.activeX.*;
import java.io.*;

//取得指定目录下面所有的doc文件名称
public class wordtohtml
{
//------------------------------------------------------------------------------
//方法原型: change(String paths)
//功能描述: 将指定目录下面所有的doc文件转化为HTML并存储在相同目录下
//输入参数: String
//输出参数: 无
//返 回 值: 无
//其它说明: 递归
//------------------------------------------------------------------------------
public static void change(String paths, String savepaths)
{

File d = new File(paths);
//取得当前文件夹下所有文件和目录的列表
File lists[] = d.listFiles();
String pathss = new String("");

//对当前目录下面所有文件进行检索
for(int i = 0; i < lists.length; i ++)
{
if(lists[i].isFile())
{
String filename = lists[i].getName();
String filetype = new String("");
//取得文件类型
filetype = filename.substring((filename.length() - 3), filename.length());

//判断是否为doc文件
if(filetype.equals("doc"))
{
System.out.println("当前正在转换......");
//打印当前目录路径
System.out.println(paths);
//打印doc文件名
System.out.println(filename.substring(0, (filename.length() - 4)));

ActiveXComponent app = new ActiveXComponent("Word.Application");//启动word

String docpath = paths + filename;
String htmlpath = savepaths + filename.substring(0, (filename.length() - 4));

String inFile = docpath;
//要转换的word文件
String tpFile = htmlpath;
//HTML文件

boolean flag = false;

try
{
app.setProperty("Visible", new Variant(false));
//设置word不可见
Object docs = app.getProperty("Documents").toDispatch();
Object doc = Dispatch.invoke(docs,"Open", Dispatch.Method, new Object[]{inFile,new Variant(false), new Variant(true)}, new int[1]).toDispatch();
//打开word文件
Dispatch.invoke(doc,"SaveAs", Dispatch.Method, new Object[]{tpFile,new Variant(8)}, new int[1]);
//作为html格式保存到临时文件
Variant f = new Variant(false);
Dispatch.call(doc, "Close", f);
flag = true;
}
catch (Exception e)
{
e.printStackTrace();
}
finally
{
app.invoke("Quit", new Variant[] {});
}
System.out.println("转化完毕!");
}
}
else
{
pathss = paths;
//进入下一级目录
pathss = pathss + lists[i].getName() + "";
//递归遍历所有目录
change(pathss, savepaths);
}
}

}
//------------------------------------------------------------------------------
//方法原型: main(String[] args)
//功能描述: main文件
//输入参数: 无
//输出参数: 无
//返 回 值: 无
//其它说明: 无
//------------------------------------------------------------------------------
public static void main(String[] args)
{

String paths = new String("D:Work2004.10.8 est system est01word");
String savepaths = new String ("D:Work2004.10.8 est system est01html");

change(paths, savepaths);

}
}

其中import的jar包是一个开源的东东,网上搜索即得。
Dispatch.invoke(doc,"SaveAs", Dispatch.Method, new Object[]{tpFile,new Variant(8)}, new int[1]);
修改Variant(8)},里面得参数即可将Word转化为各种类型。

创建于: 2004-12-31 11:12:00,修改于: 2004-12-31 11:12:00,已浏览587次,有评论0条

分享到:
评论

相关推荐

    使用Java将Word转为Html或txt!

    ### 使用Java将Word转换为Html或Txt的知识点详解 #### 一、背景介绍 在日常工作中,有时我们需要将Microsoft Word文档转换成其他格式,比如HTML或纯文本(TXT),以便于在网络环境中展示或者进行进一步的数据处理。...

    java使用poi将word转为html

    java使用poi将word转为html

    java将html文件生成word文件

    本示例主要涉及的是将HTML文件转换为Word文档,具体使用的是Java库——docx4j。这个库提供了强大的功能,可以方便地进行XML、XSL-FO到OpenXML(包括.docx和.xlsx)的转换。下面我们将深入探讨这个过程。 首先,`...

    java html转换word

    将HTML转换为Word文档的需求在数据处理、报告生成或网页内容导出时经常出现。Apache POI是Java库,专门用于处理Microsoft Office格式的文件,如Word(.doc和.docx)、Excel(.xls和.xlsx)等。在这个小例子中,我们...

    java使用poi将word文档转为html

    在本案例中,我们关注的是如何使用POI将Word文档转换为HTML格式。这个过程对于在网络上展示内容或者进行数据迁移非常有用。 首先,我们需要理解Apache POI的基本概念。POI提供了HWPF(Horrible Word Processor ...

    通过java将word文档转换成html页面

    以下是一个详细的步骤,解释如何使用Java和JACOB将Word文档转换为HTML: 1. **环境配置**:首先,你需要在你的开发环境中安装JACOB库。这通常包括下载JACOB的jar文件,并将其添加到你的Java项目的类路径中。同时,...

    Java程序把Word文档直接转换成Html文件

    Java程序把Word文档直接转换成Html文件是通过使用Java和COM组件实现的。COM组件是Windows操作系统中的一种组件对象模型,它允许不同的应用程序之间进行交互。在本文中,我们使用了Jacob库,它是一个Java和Windows下...

    java将word转为html文件工具类

    java将.docx文件和.doc文件转为html文件的工具类。。。

    基于java的word转html

    在本项目中,"基于java的word转html" 提供了一个工具,利用Java的强大力量将Microsoft Word文档(.doc和.docx格式)转换为HTML格式。这个转换过程能够保留原始Word文档中的各种元素,如图片、表格、链接以及目录,...

    java POI完整示例,POI将word转HTML,数据库倒出数据到Excel等

    2. **Java POI将Word转为HTML** 在这个示例中,我们可能利用POI的HWPF库来读取Word文档,然后将其内容转换成HTML格式。这在需要在网络上显示Word内容或者希望在网页上保持文档格式时非常有用。转换过程涉及解析Word...

    实现word文件转换成html文件实现在线打开预览word文件

    - Microsoft Office本身提供了将Word文档另存为HTML的功能,但这可能丢失某些复杂格式或样式。 - 开源库如Apache POI (Java) 和python-docx (Python) 可以读取Word文档,并允许开发者自定义转换过程。 - 第三方...

    使用java将office word pdf excel ppt文件转换成html文件

    本篇文章将深入探讨如何使用Java将Office Word、PDF、Excel和PPT文件转换为HTML文件。 首先,我们需要了解的是,Java中的文件转换通常依赖于第三方库,因为Java标准库并不直接支持这些特定的转换功能。以下是一些...

    java poi把word文档转化为html,支持doc。

    3. **转化过程**: 转换Word到HTML的过程通常涉及解析Word文档的内容,包括文本、样式、图片等,然后将这些元素重构为HTML标签。POI库提供API来访问Word文档的各个部分,如段落、表格、列表、图片等。 4. **使用步骤...

    word转html java

    在Java开发中,有时我们需要将Microsoft Word文档转换为HTML格式,以便在网络上发布或者进行其他处理。这个过程可以通过Apache POI库来实现,该库允许Java程序员读取、创建和修改MS Office格式的文件,包括Word文档...

    word文档转成Html方案

    通常,这个过程会涉及到解析Word文档的内部结构,提取文本、样式和图像等元素,然后使用Jsoup或其他HTML生成工具将它们转化为符合HTML规范的结构。 在实际应用中,扩展富文本编辑器,如Ueditor,以支持Word导入功能...

    使用java将word文档转化为html格式.pdf

    3. **使用JACOB将Word转为HTML** - **核心代码**:在Java代码中,首先创建一个`ActiveXComponent`实例,代表Word应用程序。然后设置Word不可见,避免在转换过程中显示Word界面。 - **打开Word文档**:通过`...

    java将html转word并将图片打进word内,离线可看

    完整项目包括所有jar包,完美支持html转word,并解决图片断网不能访问的问题。调用HtmlToWord类测试即可,注意修改调用文件的路径,因里面用到jacob,需要将jacob.dll拷贝到项目所在jre\bin目录下面

    Java读取word文档内容并输出成网页(含图片,公式)

    在这个场景中,我们将重点讨论如何使用Java POI读取Word文档并将其内容转换为HTML网页,同时确保图片和公式等复杂元素能够正确显示。 首先,你需要在你的Java项目中引入Apache POI库。可以通过Maven或Gradle来添加...

    POI将文件转为html

    首先,我们从标题"POI将文件转为html"入手。Apache POI是Apache软件基金会的一个开源项目,提供了一套API用于读写Microsoft Office格式的文件。在转换过程中,POI能够解析这些文件的内部结构,并将其内容转化为HTML...

    java 读写word 转html 等操作实例及jar包

    在Java编程环境中,读写Word文档以及将Word转换为HTML是一项常见的需求,特别是在处理报告、文档自动化或数据迁移等场景中。本实例将探讨如何利用Java实现这些功能,并提供相关的jar包支持。以下是对这些操作的详细...

Global site tag (gtag.js) - Google Analytics