`
- 浏览:
165795 次
- 性别:
- 来自:
成都
-
前一段时间为这个问题头疼的不得了,后来查阅了资料终于解决了;现将程序放出,以便以后参考。
//------------------------------------------------------------------------------
//文件名称: wordtohtml 文件版本: 1.00.00
//作 者: 郭铸 作者邮箱: kookman1983@yahoo.com.cn 完成日期: 2004-10-20
//文件描述:
//其它描述:
//类 列 表:
// wordtohtml: 将指定目录下面所有的doc文件转化为HTML并存储在相同目录下
//修改历史:
// # 版本 修改日期 作者 修改内容
// ----------------------------------------------------------------------------
// 1 1.00.01 2004-10-14 作者姓名 修改内容描述
// ----------------------------------------------------------------------------
//------------------------------------------------------------------------------
import com.jacob.com.*;
import com.jacob.activeX.*;
import java.io.*;
//取得指定目录下面所有的doc文件名称
public class wordtohtml
{
//------------------------------------------------------------------------------
//方法原型: change(String paths)
//功能描述: 将指定目录下面所有的doc文件转化为HTML并存储在相同目录下
//输入参数: String
//输出参数: 无
//返 回 值: 无
//其它说明: 递归
//------------------------------------------------------------------------------
public static void change(String paths, String savepaths)
{
File d = new File(paths);
//取得当前文件夹下所有文件和目录的列表
File lists[] = d.listFiles();
String pathss = new String("");
//对当前目录下面所有文件进行检索
for(int i = 0; i < lists.length; i ++)
{
if(lists[i].isFile())
{
String filename = lists[i].getName();
String filetype = new String("");
//取得文件类型
filetype = filename.substring((filename.length() - 3), filename.length());
//判断是否为doc文件
if(filetype.equals("doc"))
{
System.out.println("当前正在转换......");
//打印当前目录路径
System.out.println(paths);
//打印doc文件名
System.out.println(filename.substring(0, (filename.length() - 4)));
ActiveXComponent app = new ActiveXComponent("Word.Application");//启动word
String docpath = paths + filename;
String htmlpath = savepaths + filename.substring(0, (filename.length() - 4));
String inFile = docpath;
//要转换的word文件
String tpFile = htmlpath;
//HTML文件
boolean flag = false;
try
{
app.setProperty("Visible", new Variant(false));
//设置word不可见
Object docs = app.getProperty("Documents").toDispatch();
Object doc = Dispatch.invoke(docs,"Open", Dispatch.Method, new Object[]{inFile,new Variant(false), new Variant(true)}, new int[1]).toDispatch();
//打开word文件
Dispatch.invoke(doc,"SaveAs", Dispatch.Method, new Object[]{tpFile,new Variant(8)}, new int[1]);
//作为html格式保存到临时文件
Variant f = new Variant(false);
Dispatch.call(doc, "Close", f);
flag = true;
}
catch (Exception e)
{
e.printStackTrace();
}
finally
{
app.invoke("Quit", new Variant[] {});
}
System.out.println("转化完毕!");
}
}
else
{
pathss = paths;
//进入下一级目录
pathss = pathss + lists[i].getName() + "\\";
//递归遍历所有目录
change(pathss, savepaths);
}
}
}
//------------------------------------------------------------------------------
//方法原型: main(String[] args)
//功能描述: main文件
//输入参数: 无
//输出参数: 无
//返 回 值: 无
//其它说明: 无
//------------------------------------------------------------------------------
public static void main(String[] args)
{
String paths = new String("D:\\Work\\2004.10.8\\test system\\test01\\word\\");
String savepaths = new String ("D:\\Work\\2004.10.8\\test system\\test01\\html\\");
change(paths, savepaths);
}
}
其中import的jar包是一个开源的东东,网上搜索即得。
Dispatch.invoke(doc,"SaveAs", Dispatch.Method, new Object[]{tpFile,new Variant(8)}, new int[1]);
修改Variant(8)},里面得参数即可将Word转化为各种类型。
本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/guoxiaoshou2000/archive/2004/12/07/208024.aspx
分享到:
Global site tag (gtag.js) - Google Analytics
相关推荐
在日常工作中,有时我们需要将Microsoft Word文档转换成其他格式,比如HTML或纯文本(TXT),以便于在网络环境中展示或者进行进一步的数据处理。Java作为一种广泛应用的编程语言,提供了多种工具和库来实现这种转换...
Java程序把Word文档直接转换成Html文件是通过使用Java和COM组件实现的。COM组件是Windows操作系统中的一种组件对象模型,它允许不同的应用程序之间进行交互。在本文中,我们使用了Jacob库,它是一个Java和Windows下...
以下是一个详细的步骤,解释如何使用Java和JACOB将Word文档转换为HTML: 1. **环境配置**:首先,你需要在你的开发环境中安装JACOB库。这通常包括下载JACOB的jar文件,并将其添加到你的Java项目的类路径中。同时,...
将HTML转换为Word文档的需求在数据处理、报告生成或网页内容导出时经常出现。Apache POI是Java库,专门用于处理Microsoft Office格式的文件,如Word(.doc和.docx)、Excel(.xls和.xlsx)等。在这个小例子中,我们...
本示例主要涉及的是将HTML文件转换为Word文档,具体使用的是Java库——docx4j。这个库提供了强大的功能,可以方便地进行XML、XSL-FO到OpenXML(包括.docx和.xlsx)的转换。下面我们将深入探讨这个过程。 首先,`...
标题和描述中提到的"实现word文件转换成html文件实现在线打开预览word文件",这是一个关于将Microsoft Word文档转换为HTML格式,以便在网页上预览的技术问题。下面将详细介绍这个过程涉及的关键知识点。 1. **...
转换过程涉及到解析Word文档的XML结构,并将其转换成HTML标签。 Java中一个常用的库是Apache POI,它是一个用于处理Microsoft Office格式文件的库,包括Word文档。Apache POI提供了一套API,允许开发者读取、写入和...
本篇文章将深入探讨如何使用Java将Office Word、PDF、Excel和PPT文件转换为HTML文件。 首先,我们需要了解的是,Java中的文件转换通常依赖于第三方库,因为Java标准库并不直接支持这些特定的转换功能。以下是一些...
在本项目中,"基于java的word转html" 提供了一个工具,利用Java的强大力量将Microsoft Word文档(.doc和.docx格式)转换为HTML格式。这个转换过程能够保留原始Word文档中的各种元素,如图片、表格、链接以及目录,...
java使用poi将word转为html
Java 使用 Jacob 库将 Office 文件转换为 HTML 是一个常见的需求,尤其在自动化处理文档或在线预览场景中。Jacob(Java and COM Bridge)是一个 Java 库,它允许 Java 应用程序通过 COM(Component Object Model)...
为了提供这种功能,开发者通常会使用各种库和工具,但本话题关注的是如何在不依赖外部套件的情况下,使用Java语言直接实现Word和Excel到HTML的转换,从而进行在线预览。 首先,我们要理解这个过程涉及到的主要技术...
在这个示例中,我们可能利用POI的HWPF库来读取Word文档,然后将其内容转换成HTML格式。这在需要在网络上显示Word内容或者希望在网页上保持文档格式时非常有用。转换过程涉及解析Word文档的各个部分,如段落、表格和...
java实现word转换成html实现word预览
在本案例中,我们关注的是如何使用POI将Word文档转换为HTML格式。这个过程对于在网络上展示内容或者进行数据迁移非常有用。 首先,我们需要理解Apache POI的基本概念。POI提供了HWPF(Horrible Word Processor ...
在本案例中,我们关注的是如何使用Apache POI将Word文档转换为HTML格式,并且保持原有的样式、表格和图片。下面我们将详细介绍这个过程中的关键知识点。 1. **Apache POI简介** Apache POI 提供了Java API,使得...
3. **转化过程**: 转换Word到HTML的过程通常涉及解析Word文档的内容,包括文本、样式、图片等,然后将这些元素重构为HTML标签。POI库提供API来访问Word文档的各个部分,如段落、表格、列表、图片等。 4. **使用步骤...
在Java编程环境中,将Word文档转换为HTML是一种常见的需求,特别是在数据处理、文档共享或网页展示等场景。本文将详细讲解如何使用Java实现这一功能,包括必要的库引用、代码示例以及转换过程。 首先,我们需要引入...
在Java开发中,有时我们需要将HTML内容转换成Word文档,以便于阅读、编辑或打印。这个过程涉及到HTML解析、格式转换以及可能的图像处理。在本文中,我们将深入探讨如何在Java中实现这一功能,以及需要用到的关键库和...
因此,需要将它们转换为PNG或JPEG等Web友好的格式。这可以通过使用图像转换库,如Apache Batik或第三方库wmf2png来完成。 4. **生成HTML代码**:将遍历得到的所有元素转换为HTML字符串,并组合成完整的HTML文件。这...