由于任务要有从OA与网站数据交换这个需求,在OA中编辑的都是word文件,这些文件申核通过后就要发布到网站的相应栏目中,所以在将word文件另存为html格式的时候,找了许多现成的代码,现在整理一下,希望有类似功能的朋友可以支持拿去参考.我的环境是 Window2003,jdk1.6.0,Tomcat5.517.
在写代码之前一定要有jacob.jar和jacob.dll这两个文件,和大多数介绍jacob的文章一样,这两个文件要分别下载的,jacob.dll是yahoo讨论组的,而jacob.jar是它的官方网站下载的.我用的版本是1.7;首先要把jacob.dll这个文件放到 jdk1.6.0\jre\bin下面,而不是放到system32这下,关于这点我试了很多次,困扰了我很久.jacob.jar直接放到项目的 web-inf\lib下就可以了.下面是代码
//**
* 将指定路径的Word文件生成Html文件
*
* @param filename
* word文件存放路径及文件名,可以是网络地址
* @param savefilename
* 生成后的html存放路径及文件名
*/
public static void WordToHtml(String filename, String savefilename)
{
ActiveXComponent app = new ActiveXComponent("Word.Application");// 启动word
try
{
app.setProperty("Visible", new Variant(false));
// 设置word不可见
Object docs = app.getProperty("Documents").toDispatch();
Object doc = Dispatch.invoke(docs, "Open", Dispatch.Method, new Object[] { filename, new Variant(false), new Variant(true) }, new int[1]).toDispatch();
// 打开word文件
Dispatch.invoke(doc, "SaveAs", Dispatch.Method, new Object[] ...{ savefilename, new Variant(8) }, new int[1]);
// 作为html格式保存到临时文件
Dispatch.call(doc, "Close", new Variant(false));
}
catch (Exception e)
{
e.printStackTrace();
}
finally
{
app.invoke("Quit", new Variant[] ...{});
app = null;
}
}
分享到:
相关推荐
下面我们将详细讨论如何使用jacob库将Word文档转换为HTML。 首先,你需要在项目中引入jacob库。通常,这涉及到下载jacob.jar文件并将其添加到项目的类路径中。如果是MyEclipse这样的集成开发环境(IDE),你可以在...
在IT行业中,转换文档格式是一项常见的任务,例如将Word文档转换为HTML网页。"通过jacob实现word转为HTML"这个主题就是关于如何利用Java的一个库——Jacob来完成这项工作。Jacob是一个Java到COM桥接库,允许Java程序...
"jacob 1.9 word文件格式转换"是一个利用Jacob库来实现的解决方案,它能够将Microsoft Word文档转换为HTML格式,同时保持原有的样式和图片。下面我们将深入探讨这个主题。 首先,Jacob是一个Java和COM(Component ...
在上述代码中,`loadJacobLibrary()`方法用于加载`jacob`库,`new ActiveXComponent("Word.Application")`创建了Word对象,`Dispatch.open()`打开指定路径的Word文档,`Dispatch.saveAs()`则将文档另存为HTML格式,...
例如,Word中的`SaveAs`方法可以接受不同的文件格式参数,将文档另存为其他格式。转换为PDF可能需要调用`SaveAs2`方法,并传入`wdFormatPDF`作为格式参数。 5. **处理数据**:Jacob还允许读取和写入文件中的数据。...
6. **使用Jacob进行更复杂的转换**: 如果需要保留更复杂的格式(如页眉、页脚、页码等),可以利用Jacob启动一个后台的Microsoft Word实例,通过COM接口直接将Word文档另存为HTML。 7. **注释与文档**: 代码应包含...
本文将深入探讨如何利用Java程序将Word文档转换成HTML文件,包括技术背景、具体实现步骤以及代码解析。 ### 技术背景 在Java中,实现Word文档到HTML文件的转换主要依赖于以下技术: 1. **Java和COM交互**:Java...
本文将详细介绍如何使用Java和Jacob库将Word文档转换为HTML文件。 #### 二、Jacob库介绍 Jacob是Java和Windows下的Com桥接工具,它允许Java程序调用COM组件。对于Java开发者来说,这意味着可以利用Windows平台上的...
在获取到`Document`对象后,我们可以调用它的`SaveAs`方法,将文档另存为HTML格式。`SaveAs`方法需要指定保存的文件路径和文件类型。 ```java String htmlPath = "C:\\path\\to\\your\\document.html"; Dispatch....
在这个特定的Demo中,我们将利用Jacob调用Office工具的"另存为"功能,将HTML文档转换为Excel格式。 在开始之前,确保你已经正确安装了Jacob的库文件。在提供的压缩包中,"jacob-1.18-M2"包含了Jacob的JAR文件,你...
通过上述步骤,我们可以利用Jacob-1.17-M2在64位或32位操作系统上实现Word文档到HTML的转换,这对于需要处理大量文档格式转换的项目来说非常实用。在使用过程中,根据具体需求进行代码调整和优化,可以大大提高工作...
标题“java实现office、wps转pdf,pdf转word”指的是利用Java编程来实现在不同办公文档格式间的转换,特别是从Microsoft Office和WPS格式转换为PDF,以及从PDF反向转换为Word文档。 首先,让我们讨论从Office和WPS...
在提供的文件"OfficeToHtml.java"中,我们可以推测这可能是一个示例程序,用于将Microsoft Office文档转换为HTML格式。这通常涉及到调用Microsoft Word或Excel的COM接口,利用它们的自动化功能来打开文档,然后将...
4. 对于"word转pdf",可以利用Microsoft Word的"另存为"功能,选择PDF格式进行保存。 需要注意的是,使用JACOB时需要确保系统中安装了相应的Microsoft Office版本,且JACOB能够成功识别和访问COM组件。此外,因为...
根据给定的信息,本文将详细解释如何利用Java技术将Microsoft Word文档轻松地转换为HTML文件。此过程涉及到了Java与Windows COM对象之间的交互,并利用了Jacob库作为桥梁,实现跨平台调用Word对象来完成文档格式转换...
这将把当前选中的范围(每个章节)保存为一个单独的HTML文件。 6. **释放资源**:最后,确保关闭所有打开的Word文档和终止Word进程,避免资源泄漏。 在实际开发中,为了提高效率和可维护性,可以将以上步骤封装成...
5. **保存为HTML**:调用`Dispatch`对象的`SaveAs`方法,将当前打开的文档另存为HTML格式,例如`Dispatch.call(wordDoc, "SaveAs", htmlPath, new Variant(Variant.VT_I4, 16))`,其中16表示文件类型为HTML。...
OpenOffice是一款开源的办公软件套件,它支持多种文件格式,包括Microsoft Office的Word、PowerPoint和Excel。在处理跨平台或需要固定布局的文档时,将这些文档转换为PDF或HTML格式非常有用。本文将详细讲解如何使用...
2. 将模板另存为XML格式,例如:“测试.xml”,然后修改XML文件中的占位符,如将`<title>`改为`${title}`。 3. 将XML文件改名为`.ftl`扩展名,如“测试.ftl”,并将模板文件放入项目的指定目录。 4. 引入FreeMarker...
13.最终用户可以浏览 Word/Excel/Ppt 文档内容,但需要禁止复制、粘贴、下载、另存的; 14.需要在html页面中在线编辑Word公文的; 15.需要在协同办公中强制保留Word修改痕迹的; 16.需要在协同办公中手写批注、手写...