`
kuaile863
  • 浏览: 115745 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

通过jacob实现word转为HTML

阅读更多

 

这几天研究jacob原本的需求是将word显示到FCK中,于是就想到用jacob去做。它允许在java中调用com接口自动组件,它使用JNI(本地调用程序)来进行本地调用COM库。它可运行在x86和支持32位和64Java虚拟机 X64的环境。

 

首先下载Jacob包,JDK1.5以上需要使用Jacob1.9版本(JDK1.6尚未测试)

1、将压缩包解压后,Jacob.jar添加到Libraries中;

2、将Jacob.dll放至“WINDOWS\SYSTEM32”下面。

 

需要注意的是:

【使用IDE启动Web服务器时,系统读取不到Jacob.dll,例如用MyEclipse启动Tomcat,就需要将dll文件copyMyEclipse安装目录的“jre\bin”下面。

一般系统没有加载到Jacob.dll文件时,报错信息为:“java.lang.UnsatisfiedLinkError: no jacob in java.library.path”】

 

下面是代码:

  

package com.gra.util;

 

 

 

import com.jacob.activeX.ActiveXComponent;

import com.jacob.com.Dispatch;

import com.jacob.com.Variant;

 

 

 

public class JacobUtil {

         public static final int WORD_HTML = 8;

 

         public static final int WORD_TXT = 7;

 

         public static final int EXCEL_HTML = 44;

 

         /**

          * WORD转HTML

          * 

          * @param docfile

          *            WORD文件全路径

          * @param htmlfile

          *            转换后HTML存放路径

          */

         public void wordToHtml(String docfile, String htmlfile) {

                   ActiveXComponent app = new ActiveXComponent("Word.Application"); // 启动word

                   try {

                            // 设置word不可见

                            app.setProperty("Visible", new Variant(false));

                            //获得documents对象

                            Dispatch docs = (Dispatch) app.getProperty("Documents")

                                               .toDispatch();

                            //打开文件

                            Dispatch doc = Dispatch.invoke(

                                               docs,

                                               "Open",

                                               Dispatch.Method,

                                               new Object[] { docfile, new Variant(false),

                                                                 new Variant(true) }, new int[1]).toDispatch();

                            //保存新的文件

                            Dispatch.invoke(doc, "SaveAs", Dispatch.Method, new Object[] {

                                               htmlfile, new Variant(WORD_HTML) }, new int[1]);

                            Variant f = new Variant(false);

                            Dispatch.call(doc, "Close", f);

                   } catch (Exception e) {

                            e.printStackTrace();

                   } finally {

                            app.invoke("Quit", new Variant[] {});

                   }

         }

 

         

 

}

 

 

 

测试代码:

public class JunitTest {

 

    @Test

    public void test2() {

       JacobUtil ju = new JacobUtil();

       String docfile = "D:\\2012.doc";

       String htmlfile = "D:\\2012.html";

       ju.wordToHtml(docfile, htmlfile);

 

    }

}

 注: 附件为jacob的API

 

 

 

1
0
分享到:
评论

相关推荐

    使用jacob将word转换为html的完整代码

    在IT行业中,有时候我们需要在不同的格式之间转换文档,例如从Microsoft Word(.doc或.docx)转换成HTML(超文本标记语言)。在这种情况下,我们可以利用Java的库来实现这一功能。"jacob"是一个Java库,它允许Java...

    java使用jacob将word,excel,ppt转成html

    下面,我们将详细探讨如何使用 Jacob 实现 Word、Excel 和 PowerPoint 文件到 HTML 的转换。 1. **Java 与 Jacob 集成** - 在 Java 项目中引入 Jacob 库,通常需要将 `jacob-x.x.x.dll` 文件放在系统的 PATH 环境...

    jacob将word转成html

    【标题】"jacob将word转成html"指的是使用Jacob库进行Microsoft ...综上所述,"jacob将word转成html"是一种利用Jacob库在Java中实现的Word到HTML转换方案,它依赖于COM接口和Windows环境,能有效地保持文档的原始格式。

    使用jacob把word转化成html

    以下是使用JACOB将Word文档转换为HTML的详细步骤: 1. **下载并安装JACOB** - 访问JACOB的下载地址(例如:http://download.csdn.net/detail/maosijunzi/38513832),下载jacob.jar和jacob.dll文件。 - 将jacob....

    JACOB操作word和excel示例

    在“如何使用jacob将word转换为PDF.doc”这个示例中,我们将学习如何使用Jacob将Word文档转换成PDF格式。以下是基本步骤: 1. **设置Jacob环境**:首先,你需要在项目中添加Jacob的jar文件,并确保系统路径中包含...

    word转换成html程序及所需jacob架包

    本资源包含了一个用于将Word文档转换为HTML格式的程序以及所需的JACOB(Java和COM Bridge)库。以下是对这些概念的详细说明: 1. **Word**: Microsoft Word是一款由微软公司开发的文本处理软件,广泛用于创建、编辑...

    jacob word转html

    `jacob`通过COM自动化接口与Word应用程序进行通信,就像一个用户手动打开Word并执行转换操作一样。在Java程序中,我们首先需要加载`jacob`的动态链接库(DLL),然后创建一个`ActiveXComponent`对象来代表Word应用,...

    使用Jacob转换word变成html

    用Jacob,把word文档转换为html,还是很好用的,格式什么的也都保持很好; 需要说明的几点:1.要保证本地有office软件,才可以正常转换;2.jacob.dll放到jdk-->jre-->bin 路径下;3.把jacob.jar包加入到你的工程中;

    word转html带目录结构的实现方式.docx

    在IT领域,特别是在文档处理方面,有时需要将Microsoft Word文档转换成HTML格式,以便在网页上展示或进行在线阅读。在转换过程中,保持原有的目录结构对于用户导航非常关键。本篇将详细介绍如何在Java环境下实现Word...

    jacob将word文档转换为html显示(struts文件上传)

    总结来说,"jacob将word文档转换为html显示(struts文件上传)"这个主题涉及到的技术包括:Java的Jacob库用于调用COM组件,实现与Word交互;Struts框架的文件上传机制;以及Word到HTML的转换逻辑。这些技术在Web开发...

    通过java将word文档转换成html页面

    通过以上步骤,你可以使用Java和JACOB库实现从Word到HTML的转换。值得注意的是,这种方法会尽可能保留原始Word文档的格式,但不保证完全一致,因为HTML和Word的样式处理存在差异。此外,JACOB的性能可能会受到系统...

    Java程序把Word文档直接转换成Html文件

    Java程序把Word文档直接转换成Html文件是通过使用Java和COM组件实现的。COM组件是Windows操作系统中的一种组件对象模型,它允许不同的应用程序之间进行交互。在本文中,我们使用了Jacob库,它是一个Java和Windows下...

    java实现excel转换成html

    标题"java实现excel转换成html"指出,我们将使用Java编程语言,通过Jacob库来实现Excel文件到HTML的转换。Jacob全称为JavaCOM Bridge,它是一个开源项目,提供了Java对COM组件的访问,使我们能够利用Microsoft ...

    利用jacob将office转换成html

    1.将jacob.jar导入到项目的lib中去 2.将Jacob.dll放至“WINDOWS\SYSTEM32”下面(或者放在对应的jdk目录下 如:C:\Program ...附:可以通过System.out.println(System.getProperty("java.library.path"))查出jdk的信息

    基于java的word转html

    总的来说,这个基于Java的Word转HTML工具利用了Jacob库的强大功能,实现了Word文档向HTML的高效转换,同时保留了文档的复杂结构和视觉效果。这在数据迁移、文档共享或者网络发布等场景下具有很高的实用价值。用户只...

    Html转Word(doc,docx),带样式以及图片

    在Java中,可以使用Jacob来实现HTML到Word的转换。 5. **编程实现**: 转换过程可以通过编程实现,如使用Java、Python、C#等语言,利用库如Apache POI、jsoup、python-docx等。这些库提供了操作Word文档的API,...

    巧用Java程序把Word转换成Html文件

    本文将深入探讨如何利用Java程序将Word文档转换成HTML文件,包括技术背景、具体实现步骤以及代码解析。 ### 技术背景 在Java中,实现Word文档到HTML文件的转换主要依赖于以下技术: 1. **Java和COM交互**:Java...

    java实现word、Excel、ppt文件转换成html格式

    把jacob.jar加载到工程里。 在C:\WINDOWS\system32;C:\Program Files\Java\jdk1.5.0_04\bin;C:\Program Files\Java\jdk1.5.0_04\jre\bin;下添加jacob.dll文件。 OfficeToXML.java文件是实现代码。 我自己工程用到...

Global site tag (gtag.js) - Google Analytics