`
songhongchen
  • 浏览: 122760 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

利用jacob将word另存为html格式文件

阅读更多
由于任务要有从OA与网站数据交换这个需求,在OA中编辑的都是word文件,这些文件申核通过后就要发布到网站的相应栏目中,所以在将word文件另存为html格式的时候,找了许多现成的代码,现在整理一下,希望有类似功能的朋友可以支持拿去参考.我的环境是 Window2003,jdk1.6.0,Tomcat5.517.

        在写代码之前一定要有jacob.jar和jacob.dll这两个文件,和大多数介绍jacob的文章一样,这两个文件要分别下载的,jacob.dll是yahoo讨论组的,而jacob.jar是它的官方网站下载的.我用的版本是1.7;首先要把jacob.dll这个文件放到 jdk1.6.0\jre\bin下面,而不是放到system32这下,关于这点我试了很多次,困扰了我很久.jacob.jar直接放到项目的 web-inf\lib下就可以了.下面是代码
//**
     * 将指定路径的Word文件生成Html文件
     * 
     * @param filename
     *            word文件存放路径及文件名,可以是网络地址
     * @param savefilename
     *            生成后的html存放路径及文件名
     */
    public static void WordToHtml(String filename, String savefilename)
    {
        ActiveXComponent app = new ActiveXComponent("Word.Application");// 启动word
        try
        {
            app.setProperty("Visible", new Variant(false));
            // 设置word不可见
            Object docs = app.getProperty("Documents").toDispatch();
            Object doc = Dispatch.invoke(docs, "Open", Dispatch.Method, new Object[] { filename, new Variant(false), new Variant(true) }, new int[1]).toDispatch();
            // 打开word文件
            Dispatch.invoke(doc, "SaveAs", Dispatch.Method, new Object[] ...{ savefilename, new Variant(8) }, new int[1]);
            // 作为html格式保存到临时文件
            Dispatch.call(doc, "Close", new Variant(false));
        }
        catch (Exception e)
        {
            e.printStackTrace();
        }
        finally
        {
            app.invoke("Quit", new Variant[] ...{});
            app = null;
        }
    }
分享到:
评论

相关推荐

    使用jacob将word转换为html的完整代码

    下面我们将详细讨论如何使用jacob库将Word文档转换为HTML。 首先,你需要在项目中引入jacob库。通常,这涉及到下载jacob.jar文件并将其添加到项目的类路径中。如果是MyEclipse这样的集成开发环境(IDE),你可以在...

    通过jacob实现word转为HTML

    在IT行业中,转换文档格式是一项常见的任务,例如将Word文档转换为HTML网页。"通过jacob实现word转为HTML"这个主题就是关于如何利用Java的一个库——Jacob来完成这项工作。Jacob是一个Java到COM桥接库,允许Java程序...

    jacob 1.9 word文件格式转换

    "jacob 1.9 word文件格式转换"是一个利用Jacob库来实现的解决方案,它能够将Microsoft Word文档转换为HTML格式,同时保持原有的样式和图片。下面我们将深入探讨这个主题。 首先,Jacob是一个Java和COM(Component ...

    jacob word转html

    在上述代码中,`loadJacobLibrary()`方法用于加载`jacob`库,`new ActiveXComponent("Word.Application")`创建了Word对象,`Dispatch.open()`打开指定路径的Word文档,`Dispatch.saveAs()`则将文档另存为HTML格式,...

    jacob jar包及依赖文件

    例如,Word中的`SaveAs`方法可以接受不同的文件格式参数,将文档另存为其他格式。转换为PDF可能需要调用`SaveAs2`方法,并传入`wdFormatPDF`作为格式参数。 5. **处理数据**:Jacob还允许读取和写入文件中的数据。...

    Word文档转换为Html格式(带架包)

    6. **使用Jacob进行更复杂的转换**: 如果需要保留更复杂的格式(如页眉、页脚、页码等),可以利用Jacob启动一个后台的Microsoft Word实例,通过COM接口直接将Word文档另存为HTML。 7. **注释与文档**: 代码应包含...

    巧用Java程序把Word转换成Html文件

    本文将深入探讨如何利用Java程序将Word文档转换成HTML文件,包括技术背景、具体实现步骤以及代码解析。 ### 技术背景 在Java中,实现Word文档到HTML文件的转换主要依赖于以下技术: 1. **Java和COM交互**:Java...

    Java程序把Word文档直接转换成HTML文件

    本文将详细介绍如何使用Java和Jacob库将Word文档转换为HTML文件。 #### 二、Jacob库介绍 Jacob是Java和Windows下的Com桥接工具,它允许Java程序调用COM组件。对于Java开发者来说,这意味着可以利用Windows平台上的...

    jacob实现doc转html

    在获取到`Document`对象后,我们可以调用它的`SaveAs`方法,将文档另存为HTML格式。`SaveAs`方法需要指定保存的文件路径和文件类型。 ```java String htmlPath = "C:\\path\\to\\your\\document.html"; Dispatch....

    jacob-1.18 Demo, 完整运行,Html转换Excel

    在这个特定的Demo中,我们将利用Jacob调用Office工具的"另存为"功能,将HTML文档转换为Excel格式。 在开始之前,确保你已经正确安装了Jacob的库文件。在提供的压缩包中,"jacob-1.18-M2"包含了Jacob的JAR文件,你...

    jacob-1.17-M2

    通过上述步骤,我们可以利用Jacob-1.17-M2在64位或32位操作系统上实现Word文档到HTML的转换,这对于需要处理大量文档格式转换的项目来说非常实用。在使用过程中,根据具体需求进行代码调整和优化,可以大大提高工作...

    java实现office、wps转pdf,pdf转word

    标题“java实现office、wps转pdf,pdf转word”指的是利用Java编程来实现在不同办公文档格式间的转换,特别是从Microsoft Office和WPS格式转换为PDF,以及从PDF反向转换为Word文档。 首先,让我们讨论从Office和WPS...

    JACOB版本1.9及调用代码

    在提供的文件"OfficeToHtml.java"中,我们可以推测这可能是一个示例程序,用于将Microsoft Office文档转换为HTML格式。这通常涉及到调用Microsoft Word或Excel的COM接口,利用它们的自动化功能来打开文档,然后将...

    pdf转图片并合成一张图片输出,图片转pdf,word转html,word转pdf

    4. 对于"word转pdf",可以利用Microsoft Word的"另存为"功能,选择PDF格式进行保存。 需要注意的是,使用JACOB时需要确保系统中安装了相应的Microsoft Office版本,且JACOB能够成功识别和访问COM组件。此外,因为...

    JAVA WORD TO HTML轻松

    根据给定的信息,本文将详细解释如何利用Java技术将Microsoft Word文档轻松地转换为HTML文件。此过程涉及到了Java与Windows COM对象之间的交互,并利用了Jacob库作为桥梁,实现跨平台调用Word对象来完成文档格式转换...

    jacob按目录拆分文档(含dll和jar),代码说明详细

    这将把当前选中的范围(每个章节)保存为一个单独的HTML文件。 6. **释放资源**:最后,确保关闭所有打开的Word文档和终止Word进程,避免资源泄漏。 在实际开发中,为了提高效率和可维护性,可以将以上步骤封装成...

    GP2S用office转html

    5. **保存为HTML**:调用`Dispatch`对象的`SaveAs`方法,将当前打开的文档另存为HTML格式,例如`Dispatch.call(wordDoc, "SaveAs", htmlPath, new Variant(Variant.VT_I4, 16))`,其中16表示文件类型为HTML。...

    OpenOffice转换Office文档为PDF、HTML

    OpenOffice是一款开源的办公软件套件,它支持多种文件格式,包括Microsoft Office的Word、PowerPoint和Excel。在处理跨平台或需要固定布局的文档时,将这些文档转换为PDF或HTML格式非常有用。本文将详细讲解如何使用...

    java导出生成word的简单方法

    2. 将模板另存为XML格式,例如:“测试.xml”,然后修改XML文件中的占位符,如将`<title>`改为`${title}`。 3. 将XML文件改名为`.ftl`扩展名,如“测试.ftl”,并将模板文件放入项目的指定目录。 4. 引入FreeMarker...

    SOAOFFICE - 微软 OFFICE 中间件

    13.最终用户可以浏览 Word/Excel/Ppt 文档内容,但需要禁止复制、粘贴、下载、另存的; 14.需要在html页面中在线编辑Word公文的; 15.需要在协同办公中强制保留Word修改痕迹的; 16.需要在协同办公中手写批注、手写...

Global site tag (gtag.js) - Google Analytics