`
入云涛
  • 浏览: 155960 次
  • 性别: Icon_minigender_1
  • 来自: 成都
社区版块
存档分类
最新评论

java word文档转HTML

    博客分类:
  • java
 
阅读更多


 本方法原理是将word文档转为PDF,然后再将PDF转为HTML,在目前来看,这个方法的转换是最有效的。

下图为转换后的效果

需要的辅助包如下,由于使用了jacob,所以你需要自己配置一下,具体配置可以google

其中wordToImageHelp.jar文件就是封装好的文件,以下是测试代码

package com;

import java.util.List;

import word.FileBean;
import word.FileHelp;


public class Test {
	public static void main(String[] args) {
		long tim1 = System.currentTimeMillis();
		//System.getProperty("java.library.path");
		FileHelp fh = new FileHelp();
		List<FileBean> beans = fh.fileTreat("D:\\test\\test.doc", "D:\\test\\");
		for(int i=0;i<beans.size();i++){
			System.out.println("当前第"+i+"页,地址:"+beans.get(i).getFileDir());
			List<String> images = beans.get(i).getImageDirList();
			for(int j=0;j<images.size();j++){
				System.out.println("图片地址"+j+":"+images.get(j));
			}
		}
		long tim2 = System.currentTimeMillis();
		System.out.println("共用时间:"+(tim2-tim1));
	}
}

 输出代码

当前第0页,地址:D:\test\1358679261980.html
图片地址0:D:\test\1358679261559.png
当前第1页,地址:D:\test\1358679263462.html
图片地址0:D:\test\1358679263306.png
共用时间:15194

 直接复制html路径,在浏览器中浏览即可。

  • 大小: 109.1 KB
  • 大小: 10.8 KB
分享到:
评论
2 楼 IT_zhlp80 2016-09-01  
差劲  不好
1 楼 lxylance 2016-04-08  
根本不行

相关推荐

    java poi把word文档转化为html,支持doc。

    综上所述,Java POI库提供了丰富的功能,使我们能够方便地处理Word文档,包括将它们转换为HTML格式。通过理解POI的工作原理和掌握相应的API,我们可以实现高效、准确的文件转换。在实际项目中,根据需求调整和优化...

    通过java将word文档转换成html页面

    在实际项目中,还可以考虑其他替代方案,如Apache POI,这是一个专门处理Microsoft Office格式的Java库,虽然它不直接支持Word到HTML的转换,但可以通过解析Word文档并手动构建HTML结构来实现。另一种方法是使用...

    word文档转成Html方案

    这个"word文档转成Html方案"提供了使用Java编程语言实现这一功能的方法。以下是对这个方案的详细解析: 首先,我们来看看核心标签:"Java"、"富文本"、"word"、"doc"和"html"。这表明我们要讨论的是一个Java项目,...

    Java程序把Word文档直接转换成Html文件

    Java程序把Word文档直接转换成Html文件 Java程序把Word文档直接转换成Html文件是通过使用Java和COM组件实现的。COM组件是Windows操作系统中的一种组件对象模型,它允许不同的应用程序之间进行交互。在本文中,我们...

    Java实现将word转换为html的方法示例【doc与docx格式】

    Java语言中实现将word文档转换为html格式的方法示例,结合实例形式分析了java针对doc与docx格式文件的相关转换操作技巧。 知识点1:Java中word文档的读取 在Java中,读取word文档可以使用Apache POI库,POI库提供...

    java 实现 word 文档的在线预览

    转换过程中,我们需要一个能够读取Word文档并将其转化为HTML的库,例如Apache POI或Spire.Doc for Java。 Apache POI是Java中处理Microsoft Office格式文件的一个流行库,它支持读写Word(.doc/.docx)文件。然而,...

    java word2007转html word2003转html

    首先,Java中进行这种转换通常依赖于第三方库,因为Java标准库并不直接支持Word文档的解析和转换。其中最著名的库之一是Apache POI,它是一个开源项目,提供了对Microsoft Office格式的支持,包括Word文档。对于Word...

    基于java的word转html

    在本项目中,"基于java的word转html" 提供了一个工具,利用Java的强大力量将Microsoft Word文档(.doc和.docx格式)转换为HTML格式。这个转换过程能够保留原始Word文档中的各种元素,如图片、表格、链接以及目录,...

    java word转html

    总的来说,Java进行Word转HTML涉及多个步骤,包括解析Word文档、提取内容、构建HTML结构以及可能的图像处理。Apache POI是这个任务的主要工具,而iText虽然强大,但在Word到HTML的转换中并非首选。在实际应用中,你...

    java将html文件生成word文件

    本示例主要涉及的是将HTML文件转换为Word文档,具体使用的是Java库——docx4j。这个库提供了强大的功能,可以方便地进行XML、XSL-FO到OpenXML(包括.docx和.xlsx)的转换。下面我们将深入探讨这个过程。 首先,`...

    java方式完整的word文件转html代码样例

    在Java编程环境中,将Word文档转换为HTML是一种常见的需求,特别是在数据处理、文档共享或网页展示等场景。本文将详细讲解如何使用Java实现这一功能,包括必要的库引用、代码示例以及转换过程。 首先,我们需要引入...

    word文档转换成html文档-保留word中的图片样式等信息

    Java库如Apache POI可以读取Word文档中的图片,并将其保存为单独的图像文件,然后在HTML中引用这些文件。这样可以保持图片的质量和原始尺寸。 2. **样式迁移**:Word文档中的字体、颜色、对齐方式等样式需要在HTML...

    Java读取word文档内容并输出成网页(含图片,公式)

    在这个场景中,我们将重点讨论如何使用Java POI读取Word文档并将其内容转换为HTML网页,同时确保图片和公式等复杂元素能够正确显示。 首先,你需要在你的Java项目中引入Apache POI库。可以通过Maven或Gradle来添加...

    Java html转word 使用FreeMarker

    这个标题“Java html转word 使用FreeMarker”暗示了一个Java项目,它利用FreeMarker模板引擎来实现HTML到Word的转换。 FreeMarker是一个开源的Java库,主要用于生成动态生成的Web页面或其他类型的文本输出,如电子...

    java实现HTML转Word

    在IT行业中,将HTML转换为Word文档是一种常见的需求,特别...总的来说,Java实现HTML转Word的过程涉及到HTML解析、文档对象模型操作以及图片处理等多个环节。理解这些概念和技术,将有助于你构建高效且灵活的转换工具。

    word文档生成html模板(freemarker)再转为pdf示例代码

    1、Word模板转html模板的操作步骤(图示例+操作描述,13张图); 2、由上述生成的html模板通过java代码生成pdf; 3、示例有本地模板和远程模板之分,可杜绝pdf标题丢失的问题; 4、资源概要:先阅读README.md文档,然后...

    java html转换word

    总的来说,通过Apache POI,我们可以利用Java实现HTML到Word的转换,但这个过程需要对HTML和Word文档的内部结构有深入的理解,以及一些额外的代码来处理解析和转换的细节。提供的jar包可能是Apache POI的库,用于...

    java使用poi将word文档转为html

    Java中的Apache POI库是一个强大的工具,用于读取、创建...总之,Apache POI使得在Java中处理Word文档变得容易,包括将Word文档转换为HTML。这种转换在许多场景下都有应用,如网站内容发布、数据迁移或报告自动化生成。

    java中html转word方法以及用到的jar包

    在Java开发中,有时我们需要将HTML内容转换成Word文档,以便于阅读、编辑或打印。这个过程涉及到HTML解析、格式转换以及可能的图像处理。在本文中,我们将深入探讨如何在Java中实现这一功能,以及需要用到的关键库和...

Global site tag (gtag.js) - Google Analytics