`
董瑞龙
  • 浏览: 107293 次
  • 性别: Icon_minigender_1
  • 来自: 青岛
社区版块
存档分类
最新评论

java批量将word转html

阅读更多
使用jacob调用word接口,另存为html。
代码如下:
package com.winning.doc;

import java.io.File;

import com.jacob.activeX.ActiveXComponent;
import com.jacob.com.Dispatch;
import com.jacob.com.Variant;

public class WordToHtml
{
	// ------------------------------------------------------------------------------
	// 方法原型: change(String paths)
	// 功能描述: 将指定目录下面所有的doc文件转化为HTML并存储在相同目录下
	// 输入参数: String
	// 输出参数: 无
	// 返 回 值: 无
	// 其它说明: 递归
	// ------------------------------------------------------------------------------
	public static boolean change(String FolderPath, String FileName,String outFolder,ActiveXComponent app)
	{

		String FileFormat = "";
		System.out.println(FolderPath);
		int fileSuffix = 4;
		if(FileName.endsWith("docx"))
		{
			FileFormat = FileName.substring(FileName.length() - 5,
					FileName.length());
			fileSuffix = 5;
		}
		else
		{
			FileFormat = FileName.substring(FileName.length() - 4,
					FileName.length());
		}
		
		System.out.println(FileFormat);

		if (FileFormat.equalsIgnoreCase(".doc")
				|| FileFormat.equalsIgnoreCase(".docx"))
		{
			
			String DocFile = FolderPath + "//" + FileName;
			String htmlFile = outFolder + "//" + FileName;

			System.out.println("word文件路径:" + DocFile);
			// word文件的完整路径

			String HtmlFile = htmlFile.substring(0,
					(htmlFile.length() - fileSuffix)) + ".html";

			System.out.println("htm文件路径:" + HtmlFile);
			// html文件的完整路径
			System.out.println(System.getProperty("java.library.path"));
			// 启动word

			try
			{
				app.setProperty("Visible", new Variant(false));
				// 设置word程序非可视化运行

				Dispatch docs = app.getProperty("Documents").toDispatch();

				Dispatch doc = Dispatch.invoke(
						docs,
						"Open",
						Dispatch.Method,
						new Object[] { DocFile, new Variant(false),
								new Variant(true) }, new int[1]).toDispatch();
				// 打开word文件

				Dispatch.invoke(doc, "SaveAs", Dispatch.Method, new Object[] {
						HtmlFile, new Variant(8) }, new int[1]);
				// 作为htm格式保存文件

				Dispatch.call(doc, "Close", new Variant(false));
				// 关闭文件

			}
			catch (Exception e)
			{
				e.printStackTrace();
			}
			// 转化完毕
			return true;
		}
		return false;
	}

	// ------------------------------------------------------------------------------
	// 方法原型: main(String[] args)
	// 功能描述: main文件
	// 输入参数: 无
	// 输出参数: 无
	// 返 回 值: 无
	// 其它说明: 无
	// ------------------------------------------------------------------------------
	public static void main(String[] args)
	{
		ActiveXComponent app = new ActiveXComponent("Word.Application");
		String paths = new String(
				"C:\\Users\\rylan\\Desktop\\公司工作\\临床路径拆分科室分类版\\所有文档");
		String pathsOut = new String(
				"C:\\Users\\rylan\\Desktop\\公司工作\\临床路径拆分科室分类版\\html");
//		String filename = "垂体催乳素瘤临床路径2011.docx";
		File docFiles = new File(paths);
		String[] names = docFiles.list();
		for (int i = 0; i < names.length; i++)
		{
			System.out.println(names[i]);
			if(!names[i].startsWith("~"))
			{
				change(paths, names[i],pathsOut, app);
			}
		}
		app.invoke("Quit", new Variant[] {});
	}
}
分享到:
评论

相关推荐

    基于java的word转html

    在本项目中,"基于java的word转html" 提供了一个工具,利用Java的强大力量将Microsoft Word文档(.doc和.docx格式)转换为HTML格式。这个转换过程能够保留原始Word文档中的各种元素,如图片、表格、链接以及目录,...

    html转Word(可批量转化但速度较慢,支持图片显示,图片在本地或网络都行)

    这个工具显然是为了弥补现有转换工具在功能上的不足,特别是在处理图片显示方面,无论图片存储在本地还是网络,都能顺利地将其嵌入到Word文档中。下面我们将深入探讨这个话题。 HTML是一种标记语言,广泛用于网页...

    批量打印(java)

    提到HTML转PDF,这里提到了一个关键文件"html2Pdf",这可能是一个库或者工具,用于将HTML页面转换为PDF文档。在Java世界里,有多个这样的库,如iText、Flying Saucer和PDFBox等。这些库能够解析HTML,保持其样式和...

    java 实现 word 文档的在线预览

    Spire.Doc for Java则提供了更完整的Word处理能力,包括将Word转换为HTML的功能。这个库可以轻松地将Word文档内容转换为HTML代码,从而在Web页面上预览。在项目中引入这个jar包,就可以调用其API实现转换。 实现...

    java实现excel转换成html

    本篇文章将详细探讨如何使用Java来实现Excel转HTML的功能。Java作为一种强大的编程语言,提供了多种库来处理这样的任务,其中一个常用的工具是Jacob库,它允许Java程序与Microsoft Office进行交互。 标题"java实现...

    word转html格式文件

    总的来说,这个工具通过Java和JACOB库实现了自动化将Word文档转换为HTML的功能,这对于在Web环境中处理Word文档或在服务器端进行批量转换是非常有用的。开发者可以基于`WordUtil.java`类进一步定制和优化转换过程,...

    使用jacob将word转换为html的完整代码

    下面我们将详细讨论如何使用jacob库将Word文档转换为HTML。 首先,你需要在项目中引入jacob库。通常,这涉及到下载jacob.jar文件并将其添加到项目的类路径中。如果是MyEclipse这样的集成开发环境(IDE),你可以在...

    java实现word模板的自动替换

    Java 实现Word模板的自动替换是一项常见的任务,尤其在自动化文档生成、批量报告制作等领域有着广泛应用。这个主题主要涉及到Java编程、Apache POI库以及Word文档处理的知识点。Apache POI是Java中用于读写Microsoft...

    poi word转html架包

    在"poi word转html架包"中,我们关注的是如何使用Apache POI库将Word文档转换为HTML格式。这个过程涉及到多个依赖库,如在给定的文件列表中所示,这些库支持POI在处理OOXML(Office Open XML)标准时的运作。 1. **...

    利用POI将word转换成html实现在线阅读

    在这个场景中,我们关注的是如何利用POI将Word文档转换为HTML,以便实现在线阅读。这个过程涉及多个步骤和技术,包括对Word文档的解析、内容提取以及图像处理。 首先,我们需要理解Apache POI的工作原理。POI通过...

    Word文件转化成HTML

    本篇文章将深入探讨如何使用C#编程语言将Word文件转换为HTML格式,同时保持原有的格式不变。这一过程对于那些希望在网页上展示Word内容或者需要进行跨平台文档共享的用户来说尤其重要。 首先,我们需要理解的是,...

    将2003/2007版本word转成html进行浏览

    - 对于开发者,可以使用编程语言如Python的`python-docx`和`pandoc`库,或者Java的Apache POI库来自动化批量转换。 - 这些方法允许自定义转换规则,但需要一定的编程技能。 5. **注意事项**: - 转换过程中可能...

    使用Jacob将word转换为html

    通过这种方式,你可以高效地批量处理Word文档,将其转换为HTML格式,这对于网站内容管理、数据迁移或者文档自动化处理等场景非常实用。然而,值得注意的是,由于Word和HTML的结构差异,转换后的HTML可能无法完全保留...

    Java将doc转docx工具类方法,maven项目,Idea可直接运行

    本示例提供了一个Java工具类,用于将.doc格式的Microsoft Word文档转换为较新的.docx格式。这个工具类是作为Maven项目构建的,这意味着它依赖于Maven的依赖管理系统来管理所需的库,并且可以在IntelliJ IDEA这样的...

    使用jawin将word转成html

    "使用Jawin将Word转成HTML"是一个利用Java库实现的解决方案,它允许开发者通过编程方式实现这一转换过程。 Jawin是一个Java库,它提供了与Windows API的接口,使得Java程序能够调用Windows系统中的应用程序,例如...

    Java实现doc文件转成docx文件

    本示例关注的是使用Java编程语言将传统的`.doc`格式文件转换为较新的`.docx`格式。`.doc`文件是Microsoft Word早期版本(Word 97到2003)使用的文件格式,而`.docx`则是从Word 2007开始引入的基于XML的格式。这种...

    WORD转成html

    - `HtmBuilder`:这个压缩包中的程序可能是一个简单的命令行工具或脚本,用于批量转换Word文档为HTML。使用此类工具可以大大提高效率,特别是处理大量文档时。 - 自定义脚本:使用Python、Java或其他编程语言,...

    Word转Html_支持2003,2007版本(图片获取也有)

    在此,我们将深入探讨“Word转Html”这一技术,特别是支持2003和2007版本的Word文档,以及使用Apache POI库进行实现。 Apache POI是一个流行的开源Java库,专门用于读写Microsoft Office格式的文件,包括Word、...

    java实现office转html格式

    本主题聚焦于使用Java编程语言,结合Apache POI库来实现Office文档(Word、Excel、PowerPoint)到HTML格式的转换。Apache POI是Java社区开发的一个开源项目,专门用于处理Microsoft Office格式的文件。 1. **Apache...

Global site tag (gtag.js) - Google Analytics