`
uyerp
  • 浏览: 11894 次
  • 性别: Icon_minigender_1
  • 来自: 广州
文章分类
社区版块
存档分类
最新评论

wordtohtml

阅读更多
package com.test;

import com.jacob.com.*;
import com.jacob.activeX.*;

import java.io.*;

//取得指定目录下面所有的doc文件名称
public class DirWordToHtml {
	// ------------------------------------------------------------------------------
	// 方法原型: change(String paths)
	// 功能描述: 将指定目录下面所有的doc文件转化为HTML并存储在相同目录下
	// 输入参数: String
	// 输出参数: 无
	// 返 回 值: 无
	// 其它说明: 递归
	// ------------------------------------------------------------------------------
	public static void change(String paths, String savepaths) {

		File d = new File(paths);
		// 取得当前文件夹下所有文件和目录的列表
		File lists[] = d.listFiles();
		String pathss = new String("");
		for (int i = 0; i < lists.length; i++) {
			if (lists[i].isFile()) {
				String filename = lists[i].getName();
				String filetype = new String("");
				// 取得文件类型
				filetype = filename.substring((filename.length() - 3), filename
						.length());

				// 判断是否为doc文件
				if (filetype.equals("doc")) {
					System.out.println("当前正在转换......");
					// 打印当前目录路径
					System.out.println(paths);
					// 打印doc文件名
					System.out.println(filename.substring(0,
							(filename.length() - 4)));

					ActiveXComponent app = new ActiveXComponent("Word.Application"); // 启动word

					String docpath = paths + filename;
					String htmlpath = savepaths
							+ filename.substring(0, (filename.length() - 4));

					String inFile = docpath;
					// 要转换的word文件
					String tpFile = htmlpath;
					// HTML文件
					boolean flag = false;

					try {
						ComThread.InitSTA();
						app.setProperty("Visible", new Variant(false));
						// 设置word不可见
						System.out.println(inFile);
						Dispatch docs = app.getProperty("Documents").toDispatch();
						Dispatch doc = Dispatch.invoke(
								docs,
								"Open",
								Dispatch.Method,
								new Object[] { inFile, new Variant(false),
										new Variant(true) }, new int[1]).toDispatch();
//						Object docs = app.getProperty("Documents").toDispatch();
//						Object doc = Dispatch.invoke(
//								(Dispatch) docs,
//								"Open",
//								Dispatch.Method,
//								new Object[] { inFile, new Variant(false),
//										new Variant(true) }, new int[1])
//								.toDispatch();
						// 打开word文件
//						Dispatch.invoke((Dispatch) doc, "SaveAs",
//								Dispatch.Method, new Object[] { tpFile,
//										new Variant(8) }, new int[1]);
						// 作为html格式保存到临时文件
						Dispatch.invoke(doc, "Save", Dispatch.Method, new Object[] {
								tpFile, new Variant(8) }, new int[1]);
						Variant f = new Variant(false);
						//Variant f = doc.getBuildVersion();
						//f.toString();
						Dispatch.call((Dispatch) doc, "Close", f);
						flag = true;
						ComThread.Release();
					} catch (Exception e) {
						e.printStackTrace();
					} finally {
						app.invoke("Quit", new Variant[] {});
					}
					System.out.println("转化完毕!");
				}
			} else {
				System.out.print("Folder");
				pathss = paths;
				// 进入下一级目录
				pathss = pathss + lists[i].getName() + "\\";
				// 递归遍历所有目录
				change(pathss, savepaths);
			}
		}

	}

	// ------------------------------------------------------------------------------
	// 方法原型: main(String[] args)
	// 功能描述: main文件
	// 输入参数: 无
	// 输出参数: 无
	// 返 回 值: 无
	// 其它说明: 无
	// ------------------------------------------------------------------------------
	public static void main(String[] args) {

		String paths = new String("E:\\word2html\\word");
		String savepaths = new String("E:\\word2html\\html");
		change(paths, savepaths);

	}
}
分享到:
评论
发表评论

文章已被作者锁定,不允许评论。

相关推荐

    WordToHtml源码_wordtohtml_C#_文件格式转换_

    本项目“WordToHtml源码_wordtohtml_C#_文件格式转换_”聚焦于将Microsoft Word文档转换为HTML格式,这是一种基于C#编程语言并通过Windows Forms(Winform)进行用户界面设计的应用程序。下面我们将深入探讨这一主题...

    wordToHtml

    本项目聚焦于“wordToHtml”,即如何利用Java技术将Microsoft Word的.docx文件转换为HTML格式。在此过程中,我们将主要介绍Apache POI库和xdocreport.jar包的应用。 Apache POI是一个开源的Java库,专门用于处理...

    C#编程 文件操作 WordToHTML(源码)(源码)

    C#编程 文件操作 WordToHTML(源码)(源码)C#编程 文件操作 WordToHTML(源码)(源码)C#编程 文件操作 WordToHTML(源码)(源码)C#编程 文件操作 WordToHTML(源码)(源码)C#编程 文件操作 WordToHTML(源码)(源码)C#编程 ...

    c#文件处理之WordToHtml源码.rar

    "c#文件处理之WordToHtml源码.rar"提供了一套完整的解决方案,包含ReadMe.txt说明文件和主要的WordToHtml程序。 1. **C#语言基础**:C#是Microsoft开发的一种面向对象的编程语言,广泛应用于Windows应用开发、游戏...

    WordToHtml_aspx.zip

    【压缩包子文件的文件名称】"WordToHtml_51aspx"可能是一个示例或者核心转换类的源代码文件,可能是用来演示如何在ASP.NET环境中使用提供的dll进行Word到HTML的转换。文件名中的数字"51"可能是版本号或者是代码中的...

    WordToHtml

    WordToHtml的转换技术。 有需要的可以下载看看。

    WordToHtml.rar

    【描述】"WordToHtml如何在线转换word" 提示我们这个压缩包可能提供了在线转换工具的源代码或执行程序,让用户能够通过上传Word文档,然后将其转换为HTML格式。在线转换的优势在于用户无需安装额外软件,只需浏览器...

    基于C#的文件处理源码_WordToHtml_WordToRtf_WordToText_汉字转拼音_创建PDF文档

    WordToHtml WordToRtf WordToText 操作INI文件 操作XML文件 创建PDF文档 汉字转拼音 获取本地磁盘目录 获取目录中word问文件列表 批量更名器 批量解压缩 文件分割与合并 伪装文件夹

    学生作业 C#实例源码 WordToHtml.rar

    免责声明:资料部分来源于合法的互联网渠道收集和整理,部分自己学习积累成果,供大家学习参考与交流。收取的费用仅用于收集和整理资料耗费时间的酬劳。 本人尊重原创作者或出版方,资料版权归原作者或出版方所有,...

    POI DOCX/DOC转 THML WordToHtml

    网上好多都是坑人的,要么只支持 doc ,要么就是 docx 不支持表格边框。 ... ... 文档里包含了 完整的代码 以及 所需的jar包 ( maven 引用) 本人亲测,从不欺骗。同时本人也最讨厌那些错误的代码,还要贴出来。...

    wordToHtml:将.doc转换为HTML文件

    wordToHtml 将.doc转换为HTML文件。 在需要以编程方式将大量.doc文件转换为HTML时派上用场。用法java -jar wordToHtml.jar targetDoc.doc 新文件将在html文件夹中创建。

    Word转HTML 源程序 asp.net

    在压缩包子文件的文件名称列表"WordToHTML"中,很可能是包含了这个转换程序的源代码文件或编译后的可执行文件。如果是一个源码包,用户可能需要具备一定的ASP.NET和C#编程知识来编译和运行这个项目,以便在自己的...

    poi word转html例子及jar包

    Apache POI 是一个开源项目,专门用于处理Microsoft Office格式的文件,如Word(.doc、.docx)、Excel(.xls、.xlsx)和PowerPoint(.ppt、.pptx)。在Java环境中,Apache POI 提供了API,使得开发者能够读取、创建...

    word-to-html(By Apache Poi).rar

    Apache POI是一个强大的Java库,专门用于处理Microsoft Office格式的文件,如Word、Excel和PowerPoint。... ...Apache POI提供了HWPFDocument类(用于处理旧版的Word .doc文件)和XWPFDocument类(用于处理较新的Word ....

    html

    在提供的代码片段中,我们可以看到两个方法:`WordtoHtml`和`PPttoHtml`。这两个方法都是为了将特定的Office文件格式转换为HTML。让我们逐一分析它们的工作原理: 1. `WordtoHtml`方法: - 首先,通过`ComThread....

    Spire.Office for JAVA word 转html

    public class WordtoHtml { public static void main(String[] args) { //实例化Document类的对象 Document doc = new Document(); //加载Word文档 doc.loadFromFile("inputfile.docx"); //保存为HTML格式 ...

Global site tag (gtag.js) - Google Analytics