package org.client;
// 使用Java将Word转为Html或txt!
import com.jacob.com.*;
import com.jacob.activeX.*;
import java.io.*;
public class Client {
// 取得指定目录下面所有的doc文件名称
// ------------------------------------------------------------------------------
// 方法原型: change(String paths, String savepaths)
// 功能描述: 将指定目录下面所有的doc文件转化为HTML并存储在相同目录下
// 输入参数: String
// 输出参数: 无
// 返 回 值: 无
// 其它说明: 递归
// ------------------------------------------------------------------------------
public static void change(String paths, String savepaths) {
File d = new File(paths);
// 取得当前文件夹下所有文件和目录的列表
File lists[] = d.listFiles();
String path = new String("");
// 对当前目录下面所有文件进行检索
for (int i = 0; i < lists.length; i++) {
if (lists[i].isFile()) {
String filename = lists[i].getName();
String filetype = new String("");
// 取得文件类型
filetype = filename.substring((filename.length() - 3), filename
.length());
// 判断是否为doc文件
if (filetype.equals("doc")) {
System.out.println("当前正在转换......");
// 打印当前目录路径
System.out.println(paths);
// 打印doc文件名
System.out.println(filename.substring(0,
(filename.length() - 4)));
ActiveXComponent app = new ActiveXComponent(
"Word.Application");// 启动word
String docpath = paths + filename;
String htmlpath = savepaths
+ filename.substring(0, (filename.length() - 4));
String inFile = docpath;
// 要转换的word文件
String tpFile = htmlpath;
// HTML文件
try {
app.setProperty("Visible", new Variant(false));
// 设置word不可见
Object docs = app.getProperty("Documents").toDispatch();
Object doc = Dispatch.invoke(
docs,
"Open",
Dispatch.Method,
new Object[] { inFile, new Variant(false),
new Variant(true) }, new int[1])
.toDispatch();
// 打开word文件
Dispatch.invoke(doc, "SaveAs", Dispatch.Method,
new Object[] { tpFile, new Variant(8) },
new int[1]);
// 作为html格式保存到临时文件
Variant f = new Variant(false);
Dispatch.call(doc, "Close", f);
} catch (Exception e) {
e.printStackTrace();
} finally {
app.invoke("Quit", new Variant[] {});
}
System.out.println("转化完毕!");
}
} else {
path = paths;
// 进入下一级目录
path = path + lists[i].getName() + "\\";
// 递归遍历所有目录
change(path, savepaths);
}
}
}
// ------------------------------------------------------------------------------
// 方法原型: main(String[] args)
// 功能描述: main文件
// 输入参数: 无
// 输出参数: 无
// 返 回 值: 无
// 其它说明: 无
// ------------------------------------------------------------------------------
public static void main(String[] args) {
String paths = new String("D:\\作业\\day54\\");
String savepaths = new String("D:\\作业\\day54\\");
change(paths, savepaths);
}
/*
* 其中import的jar包是一个开源的东东,网上搜索即得。 Dispatch.invoke(doc, "SaveAs",
* Dispatch.Method, new Object[]{tpFile,new Variant(8)}, new int[1]);
* 修改Variant(8)},里面得参数即可将Word转化为各种类型。
*/
}
分享到:
相关推荐
java使用poi将word转为html
本示例主要涉及的是将HTML文件转换为Word文档,具体使用的是Java库——docx4j。这个库提供了强大的功能,可以方便地进行XML、XSL-FO到OpenXML(包括.docx和.xlsx)的转换。下面我们将深入探讨这个过程。 首先,`...
将HTML转换为Word文档的需求在数据处理、报告生成或网页内容导出时经常出现。Apache POI是Java库,专门用于处理Microsoft Office格式的文件,如Word(.doc和.docx)、Excel(.xls和.xlsx)等。在这个小例子中,我们...
Java程序把Word文档直接转换成Html文件是通过使用Java和COM组件实现的。COM组件是Windows操作系统中的一种组件对象模型,它允许不同的应用程序之间进行交互。在本文中,我们使用了Jacob库,它是一个Java和Windows下...
以下是一个详细的步骤,解释如何使用Java和JACOB将Word文档转换为HTML: 1. **环境配置**:首先,你需要在你的开发环境中安装JACOB库。这通常包括下载JACOB的jar文件,并将其添加到你的Java项目的类路径中。同时,...
在本案例中,我们关注的是如何使用POI将Word文档转换为HTML格式。这个过程对于在网络上展示内容或者进行数据迁移非常有用。 首先,我们需要理解Apache POI的基本概念。POI提供了HWPF(Horrible Word Processor ...
java将.docx文件和.doc文件转为html文件的工具类。。。
在本项目中,"基于java的word转html" 提供了一个工具,利用Java的强大力量将Microsoft Word文档(.doc和.docx格式)转换为HTML格式。这个转换过程能够保留原始Word文档中的各种元素,如图片、表格、链接以及目录,...
- Microsoft Office本身提供了将Word文档另存为HTML的功能,但这可能丢失某些复杂格式或样式。 - 开源库如Apache POI (Java) 和python-docx (Python) 可以读取Word文档,并允许开发者自定义转换过程。 - 第三方...
2. **Java POI将Word转为HTML** 在这个示例中,我们可能利用POI的HWPF库来读取Word文档,然后将其内容转换成HTML格式。这在需要在网络上显示Word内容或者希望在网页上保持文档格式时非常有用。转换过程涉及解析Word...
本篇文章将深入探讨如何使用Java将Office Word、PDF、Excel和PPT文件转换为HTML文件。 首先,我们需要了解的是,Java中的文件转换通常依赖于第三方库,因为Java标准库并不直接支持这些特定的转换功能。以下是一些...
- 加载Word文档:使用POI的`HWPFDocument`类(针对.doc文件)或`XWPFDocument`类(针对.docx文件)打开Word文档。 - 遍历文档内容:通过遍历文档的各个部分,如`Paragraph`、`Table`等,获取其文本和样式信息。 -...
在Java开发中,有时我们需要将Microsoft Word文档转换为HTML格式,以便在网络上发布或者进行其他处理。这个过程可以通过Apache POI库来实现,该库允许Java程序员读取、创建和修改MS Office格式的文件,包括Word文档...
总之,这个"word文档转成Html方案"提供了一种使用Java实现Word到HTML转换的方法,适用于那些需要在富文本编辑器中展示或编辑Word内容的应用场景。通过理解并实施这个方案,开发者可以增强其应用程序的功能,提升用户...
完整项目包括所有jar包,完美支持html转word,并解决图片断网不能访问的问题。调用HtmlToWord类测试即可,注意修改调用文件的路径,因里面用到jacob,需要将jacob.dll拷贝到项目所在jre\bin目录下面
3. **使用JACOB将Word转为HTML** - **核心代码**:在Java代码中,首先创建一个`ActiveXComponent`实例,代表Word应用程序。然后设置Word不可见,避免在转换过程中显示Word界面。 - **打开Word文档**:通过`...
在这个场景中,我们将重点讨论如何使用Java POI读取Word文档并将其内容转换为HTML网页,同时确保图片和公式等复杂元素能够正确显示。 首先,你需要在你的Java项目中引入Apache POI库。可以通过Maven或Gradle来添加...
首先,我们从标题"POI将文件转为html"入手。Apache POI是Apache软件基金会的一个开源项目,提供了一套API用于读写Microsoft Office格式的文件。在转换过程中,POI能够解析这些文件的内部结构,并将其内容转化为HTML...
在本案例中,我们关注的是如何使用Apache POI将Word文档转换为HTML格式,并且保持原有的样式、表格和图片。下面我们将详细介绍这个过程中的关键知识点。 1. **Apache POI简介** Apache POI 提供了Java API,使得...