package com.test;
import com.jacob.com.*;
import com.jacob.activeX.*;
import java.io.*;
//取得指定目录下面所有的doc文件名称
public class DirWordToHtml {
// ------------------------------------------------------------------------------
// 方法原型: change(String paths)
// 功能描述: 将指定目录下面所有的doc文件转化为HTML并存储在相同目录下
// 输入参数: String
// 输出参数: 无
// 返 回 值: 无
// 其它说明: 递归
// ------------------------------------------------------------------------------
public static void change(String paths, String savepaths) {
File d = new File(paths);
// 取得当前文件夹下所有文件和目录的列表
File lists[] = d.listFiles();
String pathss = new String("");
for (int i = 0; i < lists.length; i++) {
if (lists[i].isFile()) {
String filename = lists[i].getName();
String filetype = new String("");
// 取得文件类型
filetype = filename.substring((filename.length() - 3), filename
.length());
// 判断是否为doc文件
if (filetype.equals("doc")) {
System.out.println("当前正在转换......");
// 打印当前目录路径
System.out.println(paths);
// 打印doc文件名
System.out.println(filename.substring(0,
(filename.length() - 4)));
ActiveXComponent app = new ActiveXComponent("Word.Application"); // 启动word
String docpath = paths + filename;
String htmlpath = savepaths
+ filename.substring(0, (filename.length() - 4));
String inFile = docpath;
// 要转换的word文件
String tpFile = htmlpath;
// HTML文件
boolean flag = false;
try {
ComThread.InitSTA();
app.setProperty("Visible", new Variant(false));
// 设置word不可见
System.out.println(inFile);
Dispatch docs = app.getProperty("Documents").toDispatch();
Dispatch doc = Dispatch.invoke(
docs,
"Open",
Dispatch.Method,
new Object[] { inFile, new Variant(false),
new Variant(true) }, new int[1]).toDispatch();
// Object docs = app.getProperty("Documents").toDispatch();
// Object doc = Dispatch.invoke(
// (Dispatch) docs,
// "Open",
// Dispatch.Method,
// new Object[] { inFile, new Variant(false),
// new Variant(true) }, new int[1])
// .toDispatch();
// 打开word文件
// Dispatch.invoke((Dispatch) doc, "SaveAs",
// Dispatch.Method, new Object[] { tpFile,
// new Variant(8) }, new int[1]);
// 作为html格式保存到临时文件
Dispatch.invoke(doc, "Save", Dispatch.Method, new Object[] {
tpFile, new Variant(8) }, new int[1]);
Variant f = new Variant(false);
//Variant f = doc.getBuildVersion();
//f.toString();
Dispatch.call((Dispatch) doc, "Close", f);
flag = true;
ComThread.Release();
} catch (Exception e) {
e.printStackTrace();
} finally {
app.invoke("Quit", new Variant[] {});
}
System.out.println("转化完毕!");
}
} else {
System.out.print("Folder");
pathss = paths;
// 进入下一级目录
pathss = pathss + lists[i].getName() + "\\";
// 递归遍历所有目录
change(pathss, savepaths);
}
}
}
// ------------------------------------------------------------------------------
// 方法原型: main(String[] args)
// 功能描述: main文件
// 输入参数: 无
// 输出参数: 无
// 返 回 值: 无
// 其它说明: 无
// ------------------------------------------------------------------------------
public static void main(String[] args) {
String paths = new String("E:\\word2html\\word");
String savepaths = new String("E:\\word2html\\html");
change(paths, savepaths);
}
}
分享到:
相关推荐
本项目“WordToHtml源码_wordtohtml_C#_文件格式转换_”聚焦于将Microsoft Word文档转换为HTML格式,这是一种基于C#编程语言并通过Windows Forms(Winform)进行用户界面设计的应用程序。下面我们将深入探讨这一主题...
本项目聚焦于“wordToHtml”,即如何利用Java技术将Microsoft Word的.docx文件转换为HTML格式。在此过程中,我们将主要介绍Apache POI库和xdocreport.jar包的应用。 Apache POI是一个开源的Java库,专门用于处理...
C#编程 文件操作 WordToHTML(源码)(源码)C#编程 文件操作 WordToHTML(源码)(源码)C#编程 文件操作 WordToHTML(源码)(源码)C#编程 文件操作 WordToHTML(源码)(源码)C#编程 文件操作 WordToHTML(源码)(源码)C#编程 ...
"c#文件处理之WordToHtml源码.rar"提供了一套完整的解决方案,包含ReadMe.txt说明文件和主要的WordToHtml程序。 1. **C#语言基础**:C#是Microsoft开发的一种面向对象的编程语言,广泛应用于Windows应用开发、游戏...
【压缩包子文件的文件名称】"WordToHtml_51aspx"可能是一个示例或者核心转换类的源代码文件,可能是用来演示如何在ASP.NET环境中使用提供的dll进行Word到HTML的转换。文件名中的数字"51"可能是版本号或者是代码中的...
WordToHtml的转换技术。 有需要的可以下载看看。
【描述】"WordToHtml如何在线转换word" 提示我们这个压缩包可能提供了在线转换工具的源代码或执行程序,让用户能够通过上传Word文档,然后将其转换为HTML格式。在线转换的优势在于用户无需安装额外软件,只需浏览器...
WordToHtml WordToRtf WordToText 操作INI文件 操作XML文件 创建PDF文档 汉字转拼音 获取本地磁盘目录 获取目录中word问文件列表 批量更名器 批量解压缩 文件分割与合并 伪装文件夹
免责声明:资料部分来源于合法的互联网渠道收集和整理,部分自己学习积累成果,供大家学习参考与交流。收取的费用仅用于收集和整理资料耗费时间的酬劳。 本人尊重原创作者或出版方,资料版权归原作者或出版方所有,...
网上好多都是坑人的,要么只支持 doc ,要么就是 docx 不支持表格边框。 ... ... 文档里包含了 完整的代码 以及 所需的jar包 ( maven 引用) 本人亲测,从不欺骗。同时本人也最讨厌那些错误的代码,还要贴出来。...
wordToHtml 将.doc转换为HTML文件。 在需要以编程方式将大量.doc文件转换为HTML时派上用场。用法java -jar wordToHtml.jar targetDoc.doc 新文件将在html文件夹中创建。
在压缩包子文件的文件名称列表"WordToHTML"中,很可能是包含了这个转换程序的源代码文件或编译后的可执行文件。如果是一个源码包,用户可能需要具备一定的ASP.NET和C#编程知识来编译和运行这个项目,以便在自己的...
Apache POI 是一个开源项目,专门用于处理Microsoft Office格式的文件,如Word(.doc、.docx)、Excel(.xls、.xlsx)和PowerPoint(.ppt、.pptx)。在Java环境中,Apache POI 提供了API,使得开发者能够读取、创建...
Apache POI是一个强大的Java库,专门用于处理Microsoft Office格式的文件,如Word、Excel和PowerPoint。... ...Apache POI提供了HWPFDocument类(用于处理旧版的Word .doc文件)和XWPFDocument类(用于处理较新的Word ....
在提供的代码片段中,我们可以看到两个方法:`WordtoHtml`和`PPttoHtml`。这两个方法都是为了将特定的Office文件格式转换为HTML。让我们逐一分析它们的工作原理: 1. `WordtoHtml`方法: - 首先,通过`ComThread....
public class WordtoHtml { public static void main(String[] args) { //实例化Document类的对象 Document doc = new Document(); //加载Word文档 doc.loadFromFile("inputfile.docx"); //保存为HTML格式 ...