使用jacob调用word接口,另存为html。
代码如下:
package com.winning.doc;
import java.io.File;
import com.jacob.activeX.ActiveXComponent;
import com.jacob.com.Dispatch;
import com.jacob.com.Variant;
public class WordToHtml
{
// ------------------------------------------------------------------------------
// 方法原型: change(String paths)
// 功能描述: 将指定目录下面所有的doc文件转化为HTML并存储在相同目录下
// 输入参数: String
// 输出参数: 无
// 返 回 值: 无
// 其它说明: 递归
// ------------------------------------------------------------------------------
public static boolean change(String FolderPath, String FileName,String outFolder,ActiveXComponent app)
{
String FileFormat = "";
System.out.println(FolderPath);
int fileSuffix = 4;
if(FileName.endsWith("docx"))
{
FileFormat = FileName.substring(FileName.length() - 5,
FileName.length());
fileSuffix = 5;
}
else
{
FileFormat = FileName.substring(FileName.length() - 4,
FileName.length());
}
System.out.println(FileFormat);
if (FileFormat.equalsIgnoreCase(".doc")
|| FileFormat.equalsIgnoreCase(".docx"))
{
String DocFile = FolderPath + "//" + FileName;
String htmlFile = outFolder + "//" + FileName;
System.out.println("word文件路径:" + DocFile);
// word文件的完整路径
String HtmlFile = htmlFile.substring(0,
(htmlFile.length() - fileSuffix)) + ".html";
System.out.println("htm文件路径:" + HtmlFile);
// html文件的完整路径
System.out.println(System.getProperty("java.library.path"));
// 启动word
try
{
app.setProperty("Visible", new Variant(false));
// 设置word程序非可视化运行
Dispatch docs = app.getProperty("Documents").toDispatch();
Dispatch doc = Dispatch.invoke(
docs,
"Open",
Dispatch.Method,
new Object[] { DocFile, new Variant(false),
new Variant(true) }, new int[1]).toDispatch();
// 打开word文件
Dispatch.invoke(doc, "SaveAs", Dispatch.Method, new Object[] {
HtmlFile, new Variant(8) }, new int[1]);
// 作为htm格式保存文件
Dispatch.call(doc, "Close", new Variant(false));
// 关闭文件
}
catch (Exception e)
{
e.printStackTrace();
}
// 转化完毕
return true;
}
return false;
}
// ------------------------------------------------------------------------------
// 方法原型: main(String[] args)
// 功能描述: main文件
// 输入参数: 无
// 输出参数: 无
// 返 回 值: 无
// 其它说明: 无
// ------------------------------------------------------------------------------
public static void main(String[] args)
{
ActiveXComponent app = new ActiveXComponent("Word.Application");
String paths = new String(
"C:\\Users\\rylan\\Desktop\\公司工作\\临床路径拆分科室分类版\\所有文档");
String pathsOut = new String(
"C:\\Users\\rylan\\Desktop\\公司工作\\临床路径拆分科室分类版\\html");
// String filename = "垂体催乳素瘤临床路径2011.docx";
File docFiles = new File(paths);
String[] names = docFiles.list();
for (int i = 0; i < names.length; i++)
{
System.out.println(names[i]);
if(!names[i].startsWith("~"))
{
change(paths, names[i],pathsOut, app);
}
}
app.invoke("Quit", new Variant[] {});
}
}
分享到:
相关推荐
在本项目中,"基于java的word转html" 提供了一个工具,利用Java的强大力量将Microsoft Word文档(.doc和.docx格式)转换为HTML格式。这个转换过程能够保留原始Word文档中的各种元素,如图片、表格、链接以及目录,...
这个工具显然是为了弥补现有转换工具在功能上的不足,特别是在处理图片显示方面,无论图片存储在本地还是网络,都能顺利地将其嵌入到Word文档中。下面我们将深入探讨这个话题。 HTML是一种标记语言,广泛用于网页...
提到HTML转PDF,这里提到了一个关键文件"html2Pdf",这可能是一个库或者工具,用于将HTML页面转换为PDF文档。在Java世界里,有多个这样的库,如iText、Flying Saucer和PDFBox等。这些库能够解析HTML,保持其样式和...
Spire.Doc for Java则提供了更完整的Word处理能力,包括将Word转换为HTML的功能。这个库可以轻松地将Word文档内容转换为HTML代码,从而在Web页面上预览。在项目中引入这个jar包,就可以调用其API实现转换。 实现...
本篇文章将详细探讨如何使用Java来实现Excel转HTML的功能。Java作为一种强大的编程语言,提供了多种库来处理这样的任务,其中一个常用的工具是Jacob库,它允许Java程序与Microsoft Office进行交互。 标题"java实现...
总的来说,这个工具通过Java和JACOB库实现了自动化将Word文档转换为HTML的功能,这对于在Web环境中处理Word文档或在服务器端进行批量转换是非常有用的。开发者可以基于`WordUtil.java`类进一步定制和优化转换过程,...
下面我们将详细讨论如何使用jacob库将Word文档转换为HTML。 首先,你需要在项目中引入jacob库。通常,这涉及到下载jacob.jar文件并将其添加到项目的类路径中。如果是MyEclipse这样的集成开发环境(IDE),你可以在...
Java 实现Word模板的自动替换是一项常见的任务,尤其在自动化文档生成、批量报告制作等领域有着广泛应用。这个主题主要涉及到Java编程、Apache POI库以及Word文档处理的知识点。Apache POI是Java中用于读写Microsoft...
在"poi word转html架包"中,我们关注的是如何使用Apache POI库将Word文档转换为HTML格式。这个过程涉及到多个依赖库,如在给定的文件列表中所示,这些库支持POI在处理OOXML(Office Open XML)标准时的运作。 1. **...
在这个场景中,我们关注的是如何利用POI将Word文档转换为HTML,以便实现在线阅读。这个过程涉及多个步骤和技术,包括对Word文档的解析、内容提取以及图像处理。 首先,我们需要理解Apache POI的工作原理。POI通过...
本篇文章将深入探讨如何使用C#编程语言将Word文件转换为HTML格式,同时保持原有的格式不变。这一过程对于那些希望在网页上展示Word内容或者需要进行跨平台文档共享的用户来说尤其重要。 首先,我们需要理解的是,...
- 对于开发者,可以使用编程语言如Python的`python-docx`和`pandoc`库,或者Java的Apache POI库来自动化批量转换。 - 这些方法允许自定义转换规则,但需要一定的编程技能。 5. **注意事项**: - 转换过程中可能...
通过这种方式,你可以高效地批量处理Word文档,将其转换为HTML格式,这对于网站内容管理、数据迁移或者文档自动化处理等场景非常实用。然而,值得注意的是,由于Word和HTML的结构差异,转换后的HTML可能无法完全保留...
本示例提供了一个Java工具类,用于将.doc格式的Microsoft Word文档转换为较新的.docx格式。这个工具类是作为Maven项目构建的,这意味着它依赖于Maven的依赖管理系统来管理所需的库,并且可以在IntelliJ IDEA这样的...
"使用Jawin将Word转成HTML"是一个利用Java库实现的解决方案,它允许开发者通过编程方式实现这一转换过程。 Jawin是一个Java库,它提供了与Windows API的接口,使得Java程序能够调用Windows系统中的应用程序,例如...
本示例关注的是使用Java编程语言将传统的`.doc`格式文件转换为较新的`.docx`格式。`.doc`文件是Microsoft Word早期版本(Word 97到2003)使用的文件格式,而`.docx`则是从Word 2007开始引入的基于XML的格式。这种...
- `HtmBuilder`:这个压缩包中的程序可能是一个简单的命令行工具或脚本,用于批量转换Word文档为HTML。使用此类工具可以大大提高效率,特别是处理大量文档时。 - 自定义脚本:使用Python、Java或其他编程语言,...
在此,我们将深入探讨“Word转Html”这一技术,特别是支持2003和2007版本的Word文档,以及使用Apache POI库进行实现。 Apache POI是一个流行的开源Java库,专门用于读写Microsoft Office格式的文件,包括Word、...
本主题聚焦于使用Java编程语言,结合Apache POI库来实现Office文档(Word、Excel、PowerPoint)到HTML格式的转换。Apache POI是Java社区开发的一个开源项目,专门用于处理Microsoft Office格式的文件。 1. **Apache...