前一段时间为这个问题头疼的不得了,后来查阅了资料终于解决了;现将程序放出,以便以后参考。
//------------------------------------------------------------------------------ //版权所有 (C) 浪潮集团商用系统有限公司 保留所有权利 //文件名称: wordtohtml 文件版本: 1.00.00 //作 者: 郭铸 作者邮箱: guozhu@langchao.com 完成日期: 2004-10-20 //文件描述: //其它描述: //类 列 表: // wordtohtml: 将指定目录下面所有的doc文件转化为HTML并存储在相同目录下 //修改历史: // # 版本 修改日期 作者 修改内容 // ---------------------------------------------------------------------------- // 1 1.00.01 2004-10-14 作者姓名 修改内容描述 // ---------------------------------------------------------------------------- //------------------------------------------------------------------------------ import com.jacob.com.*; import com.jacob.activeX.*; import java.io.*;
//取得指定目录下面所有的doc文件名称 public class wordtohtml { //------------------------------------------------------------------------------ //方法原型: change(String paths) //功能描述: 将指定目录下面所有的doc文件转化为HTML并存储在相同目录下 //输入参数: String //输出参数: 无 //返 回 值: 无 //其它说明: 递归 //------------------------------------------------------------------------------ public static void change(String paths, String savepaths) {
File d = new File(paths); //取得当前文件夹下所有文件和目录的列表 File lists[] = d.listFiles(); String pathss = new String("");
//对当前目录下面所有文件进行检索 for(int i = 0; i < lists.length; i ++) { if(lists[i].isFile()) { String filename = lists[i].getName(); String filetype = new String(""); //取得文件类型 filetype = filename.substring((filename.length() - 3), filename.length());
//判断是否为doc文件 if(filetype.equals("doc")) { System.out.println("当前正在转换......"); //打印当前目录路径 System.out.println(paths); //打印doc文件名 System.out.println(filename.substring(0, (filename.length() - 4)));
ActiveXComponent app = new ActiveXComponent("Word.Application");//启动word
String docpath = paths + filename; String htmlpath = savepaths + filename.substring(0, (filename.length() - 4));
String inFile = docpath; //要转换的word文件 String tpFile = htmlpath; //HTML文件
boolean flag = false;
try { app.setProperty("Visible", new Variant(false)); //设置word不可见 Object docs = app.getProperty("Documents").toDispatch(); Object doc = Dispatch.invoke(docs,"Open", Dispatch.Method, new Object[]{inFile,new Variant(false), new Variant(true)}, new int[1]).toDispatch(); //打开word文件 Dispatch.invoke(doc,"SaveAs", Dispatch.Method, new Object[]{tpFile,new Variant(8)}, new int[1]); //作为html格式保存到临时文件 Variant f = new Variant(false); Dispatch.call(doc, "Close", f); flag = true; } catch (Exception e) { e.printStackTrace(); } finally { app.invoke("Quit", new Variant[] {}); } System.out.println("转化完毕!"); } } else { pathss = paths; //进入下一级目录 pathss = pathss + lists[i].getName() + ""; //递归遍历所有目录 change(pathss, savepaths); } }
} //------------------------------------------------------------------------------ //方法原型: main(String[] args) //功能描述: main文件 //输入参数: 无 //输出参数: 无 //返 回 值: 无 //其它说明: 无 //------------------------------------------------------------------------------ public static void main(String[] args) {
String paths = new String("D:Work2004.10.8 est system est01word"); String savepaths = new String ("D:Work2004.10.8 est system est01html");
change(paths, savepaths);
} }
其中import的jar包是一个开源的东东,网上搜索即得。 Dispatch.invoke(doc,"SaveAs", Dispatch.Method, new Object[]{tpFile,new Variant(8)}, new int[1]); 修改Variant(8)},里面得参数即可将Word转化为各种类型。
|
相关推荐
### 使用Java将Word转换为Html或Txt的知识点详解 #### 一、背景介绍 在日常工作中,有时我们需要将Microsoft Word文档转换成其他格式,比如HTML或纯文本(TXT),以便于在网络环境中展示或者进行进一步的数据处理。...
java使用poi将word转为html
本示例主要涉及的是将HTML文件转换为Word文档,具体使用的是Java库——docx4j。这个库提供了强大的功能,可以方便地进行XML、XSL-FO到OpenXML(包括.docx和.xlsx)的转换。下面我们将深入探讨这个过程。 首先,`...
将HTML转换为Word文档的需求在数据处理、报告生成或网页内容导出时经常出现。Apache POI是Java库,专门用于处理Microsoft Office格式的文件,如Word(.doc和.docx)、Excel(.xls和.xlsx)等。在这个小例子中,我们...
在本案例中,我们关注的是如何使用POI将Word文档转换为HTML格式。这个过程对于在网络上展示内容或者进行数据迁移非常有用。 首先,我们需要理解Apache POI的基本概念。POI提供了HWPF(Horrible Word Processor ...
以下是一个详细的步骤,解释如何使用Java和JACOB将Word文档转换为HTML: 1. **环境配置**:首先,你需要在你的开发环境中安装JACOB库。这通常包括下载JACOB的jar文件,并将其添加到你的Java项目的类路径中。同时,...
Java程序把Word文档直接转换成Html文件是通过使用Java和COM组件实现的。COM组件是Windows操作系统中的一种组件对象模型,它允许不同的应用程序之间进行交互。在本文中,我们使用了Jacob库,它是一个Java和Windows下...
java将.docx文件和.doc文件转为html文件的工具类。。。
在本项目中,"基于java的word转html" 提供了一个工具,利用Java的强大力量将Microsoft Word文档(.doc和.docx格式)转换为HTML格式。这个转换过程能够保留原始Word文档中的各种元素,如图片、表格、链接以及目录,...
2. **Java POI将Word转为HTML** 在这个示例中,我们可能利用POI的HWPF库来读取Word文档,然后将其内容转换成HTML格式。这在需要在网络上显示Word内容或者希望在网页上保持文档格式时非常有用。转换过程涉及解析Word...
- Microsoft Office本身提供了将Word文档另存为HTML的功能,但这可能丢失某些复杂格式或样式。 - 开源库如Apache POI (Java) 和python-docx (Python) 可以读取Word文档,并允许开发者自定义转换过程。 - 第三方...
本篇文章将深入探讨如何使用Java将Office Word、PDF、Excel和PPT文件转换为HTML文件。 首先,我们需要了解的是,Java中的文件转换通常依赖于第三方库,因为Java标准库并不直接支持这些特定的转换功能。以下是一些...
3. **转化过程**: 转换Word到HTML的过程通常涉及解析Word文档的内容,包括文本、样式、图片等,然后将这些元素重构为HTML标签。POI库提供API来访问Word文档的各个部分,如段落、表格、列表、图片等。 4. **使用步骤...
在Java开发中,有时我们需要将Microsoft Word文档转换为HTML格式,以便在网络上发布或者进行其他处理。这个过程可以通过Apache POI库来实现,该库允许Java程序员读取、创建和修改MS Office格式的文件,包括Word文档...
通常,这个过程会涉及到解析Word文档的内部结构,提取文本、样式和图像等元素,然后使用Jsoup或其他HTML生成工具将它们转化为符合HTML规范的结构。 在实际应用中,扩展富文本编辑器,如Ueditor,以支持Word导入功能...
3. **使用JACOB将Word转为HTML** - **核心代码**:在Java代码中,首先创建一个`ActiveXComponent`实例,代表Word应用程序。然后设置Word不可见,避免在转换过程中显示Word界面。 - **打开Word文档**:通过`...
完整项目包括所有jar包,完美支持html转word,并解决图片断网不能访问的问题。调用HtmlToWord类测试即可,注意修改调用文件的路径,因里面用到jacob,需要将jacob.dll拷贝到项目所在jre\bin目录下面
在这个场景中,我们将重点讨论如何使用Java POI读取Word文档并将其内容转换为HTML网页,同时确保图片和公式等复杂元素能够正确显示。 首先,你需要在你的Java项目中引入Apache POI库。可以通过Maven或Gradle来添加...
首先,我们从标题"POI将文件转为html"入手。Apache POI是Apache软件基金会的一个开源项目,提供了一套API用于读写Microsoft Office格式的文件。在转换过程中,POI能够解析这些文件的内部结构,并将其内容转化为HTML...
在Java编程环境中,读写Word文档以及将Word转换为HTML是一项常见的需求,特别是在处理报告、文档自动化或数据迁移等场景中。本实例将探讨如何利用Java实现这些功能,并提供相关的jar包支持。以下是对这些操作的详细...