`
hcx_2008
  • 浏览: 122179 次
  • 性别: Icon_minigender_1
  • 来自: 西安
社区版块
存档分类
最新评论

使用Jcob将Word转为Html或txt

    博客分类:
  • J2EE
阅读更多
 //------------------------------------------------------------------------------
  //版权所有 (C) 浪潮集团商用系统有限公司  保留所有权利
  //文件名称: wordtohtml           文件版本: 1.00.00
  //作    者: 郭铸     作者邮箱: guozhu@langchao.com  完成日期: 2004-10-20
  //文件描述:
  //其它描述:
  //类 列 表:
  //  wordtohtml: 将指定目录下面所有的doc文件转化为HTML并存储在相同目录下
  //修改历史:
  //  #   版本     修改日期    作者                 修改内容
  //  ----------------------------------------------------------------------------
  //  1   1.00.01  2004-10-14  作者姓名             修改内容描述
  //  ----------------------------------------------------------------------------
  //------------------------------------------------------------------------------
  import com.jacob.com.*;
  import com.jacob.activeX.*;
  import java.io.*;
  //取得指定目录下面所有的doc文件名称
  public class wordtohtml
  {
  //------------------------------------------------------------------------------
  //方法原型: change(String paths)
  //功能描述: 将指定目录下面所有的doc文件转化为HTML并存储在相同目录下
  //输入参数: String
  //输出参数: 无
  //返 回 值: 无
  //其它说明: 递归
  //------------------------------------------------------------------------------
  public static void change(String paths, String savepaths)
  {
  
  File d = new File(paths);
  //取得当前文件夹下所有文件和目录的列表
  File lists[] = d.listFiles();
  String pathss = new String("");

  //对当前目录下面所有文件进行检索
  for(int i = 0; i < lists.length; i ++)
  {
  if(lists[i].isFile())
  {
  String filename = lists[i].getName();
  String filetype = new String("");
  //取得文件类型
  filetype = filename.substring((filename.length() - 3), filename.length());
  
  //判断是否为doc文件
  if(filetype.equals("doc"))
  {
  System.out.println("当前正在转换......");
  //打印当前目录路径
  System.out.println(paths);
  //打印doc文件名
  System.out.println(filename.substring(0, (filename.length() - 4)));
  
  ActiveXComponent app = new ActiveXComponent("Word.Application");//启动word
  
  String docpath = paths + filename;
  String htmlpath = savepaths + filename.substring(0, (filename.length() - 4));
  
  String inFile = docpath;
  //要转换的word文件
  String tpFile = htmlpath;
  //HTML文件

  boolean flag = false;
  
  try
  {
  app.setProperty("Visible", new Variant(false));
  //设置word不可见

        Object docs = app.getProperty("Documents").toDispatch();
  Object doc = Dispatch.invoke(docs,"Open", Dispatch.Method, new Object[]{inFile,new Variant(false), new Variant(true)}, new int[1]).toDispatch();
  //打开word文件
  Dispatch.invoke(doc,"SaveAs", Dispatch.Method, new Object[]{tpFile,new Variant(8)}, new int[1]);
  //作为html格式保存到临时文件
  Variant f = new Variant(false);
  Dispatch.call(doc, "Close", f);
  flag = true;
  }
  catch (Exception e)
  {
  e.printStackTrace();
  }
  finally
  {
  app.invoke("Quit", new Variant[] {});
  }
  System.out.println("转化完毕!");
  }
  }
  else
  {
  pathss = paths;
  //进入下一级目录
  pathss = pathss + lists[i].getName() + "\\";   
  //递归遍历所有目录
  change(pathss, savepaths);
  }
  }
  
  }
  //------------------------------------------------------------------------------
  //方法原型: main(String[] args)
  //功能描述: main文件
  //输入参数: 无
  //输出参数: 无
  //返 回 值: 无
  //其它说明: 无
  //------------------------------------------------------------------------------ 
  public static void main(String[] args)
  {
  
  String paths = new String("D:\\Work\\2004.10.8\\test system\\test01\\word\\");
  String savepaths = new String ("D:\\Work\\2004.10.8\\test system\\test01\\html\\");

  change(paths, savepaths);

  }
        }
分享到:
评论

相关推荐

    jcob word excel pdf java

    例如,你可以使用JCob创建一个新的Word文档,添加文本、段落,甚至执行复杂的格式化任务,如调整字体、颜色和对齐方式。 Excel方面,JCob提供了访问和操作电子表格的功能。你可以创建新的工作簿,填充数据,设置...

    jcob1.1and1.9.rar

    jcob_1[1].9.rar文件很可能是jcob 1.9版本的源码或二进制库,这为我们提供了研究和定制jcob的机会。1.9版本可能包含了一些性能优化和新功能,比如对更多COM接口的支持,或者提升了跨平台的兼容性。而jacob_1.11.1....

    OpenOffice ,jcob ,将文档转化为pdf

    例如,我们可以调用`convertToURL`或`convertToFile`方法,将当前打开的文档转换为PDF格式。转换过程中可能需要指定输出文件的位置和格式。 5. **保存和关闭**:转换完成后,记得保存转换后的PDF文件,并关闭...

    jacob word转html

    在这个场景下,`jacob`库可以用来将`.doc`或`.docx`格式的Word文档转换为HTML格式,这对于网页发布、数据迁移或者在线预览非常有用。 首先,我们需要理解`jacob`库的工作原理。`jacob`通过COM自动化接口与Word应用...

    WordBean--Java操作Word(对Jcob进行封装)

    对Jcob进行一定的封装,需要jcob包,支持对Word中的文档变量进行操作。有需要的拿去,程序中有注释。

    java操作word可操作书签

    本文将详细介绍如何使用 Java 实现这一功能,避免依赖第三方库,如 Apache POI、java2word 或 jcob。 首先,我们要明白 Word 2007 及以上版本的 .docx 文件本质上是 ZIP 压缩包,包含了一系列 XML 文件。其中,`...

    java操作word可操作书签实用.pdf

    作者曾经尝试使用第三方 JAR 包例如 POI、java2word、jcob 等,但是都没有实现成功。下面,我们将详细介绍如何使用 Java 操作 Word 可操作书签实用。 描述: Java 操作 Word 可操作书签实用 Word2007 版本其实...

    java通过 jawin和jacob 调用dll文件

    本篇文章将详细探讨如何使用JAWIN和JCOB这两个库在Java中调用DLL文件。 JAWIN(Java to Windows Interface)是一个开源项目,它的主要目标是提供一种方式,使得Java程序能够直接与Windows API进行交互。JAWIN通过...

    Java Word转PDF服务,实现pdfjs在线预览

    三种常用的word转换pdf的方式,集成了Apose,OpenOffice ,Jcob 提供了所需jar和示例源码。 本身是个转换web服务,可供其他项目对接,也可把源码文件加入的自己的项目中作为接口进行调用,稍作修改即可

    sapjco3.dll

    压缩包中的“dll安装方法.txt”很可能提供了关于如何正确安装和配置“sapjco3.dll”的详细步骤。这可能包括将文件放置到正确的位置,设置系统路径,以及任何必要的注册步骤。遵循这些指示对于确保Java应用程序能够...

    java实现TTS程序

    下面将详细探讨如何在Java中使用TTS,以及涉及的相关技术。 首先,为了在Java中使用TTS,我们需要引入一个支持TTS的库。由于Java本身并不内置TTS引擎,我们通常会依赖于外部库,如Microsoft的SAPI或者Java的内置`...

    java通过jacob调用ocx.rar

    提供的`java通过jacob调用ocx.doc`文件很可能是关于如何在Java项目中集成和使用Jacob以及OCX控件的详细指南。这份文档可能会包含步骤、示例代码、错误处理和最佳实践等内容。 通过理解以上内容,开发者可以有效地...

    swing界面嵌入ocx或dll影像控件

    swing调用OCX或dll的方法有很多,其中包括:jcob、comfyj、jawin、jni、jna等等很多方式,但是如果要显示dll或ocx的控件在swing界面上,就有点麻烦了,就像ocx在IE中显示的对象一样。最后通过SWT中嵌入OCX,然后把...

    java操作可操作书签[文].pdf

    这里主要介绍如何在没有依赖第三方库如Apache POI、java2word或jcob的情况下,使用Java来实现Word文档书签的读取和修改。 首先,我们需要理解Word 2007及更高版本的文档实际上是以`.docx`为扩展名的ZIP文件,其中...

    openoffice可能用到的一个jar包 jacob.jar

    不用理会后面的版本号,我是为了和maven中心仓库区分所以才用1.11的,说明:中心仓库的不可用,openoffice可能用到的一个jar包 jacob.jar

    javaCard开发环境配置

    JavaCard开发环境配置是将JavaCard应用程序(通常称为Applet)开发、构建和调试的集成环境设置过程。本文将详细讲解如何利用Eclipse进行JavaCard的开发,包括所需软件的安装、配置,以及创建和调试第一个Applet的...

Global site tag (gtag.js) - Google Analytics