Apache POI将HTML转换成Word
结果图如下:
package com.poi.word; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; import java.io.OutputStream; import org.apache.poi.poifs.filesystem.DirectoryEntry; import org.apache.poi.poifs.filesystem.POIFSFileSystem; /** * HTML 转换 Word * @author LGF 2015-01-04 * */ public class HTML2Word { public static void main(String[] args) throws Exception { //创建 POIFSFileSystem 对象 POIFSFileSystem poifs = new POIFSFileSystem(); //获取DirectoryEntry DirectoryEntry directory = poifs.getRoot(); //创建输出流 OutputStream out = new FileOutputStream("src/html_to_word.doc"); try { //创建文档,1.格式,2.HTML文件输入流 directory.createDocument("WordDocument", getInputStream("word.html")); //写入 poifs.writeFilesystem(out); //释放资源 out.close(); System.out.println("success"); } catch (IOException e) { e.printStackTrace(); } } /** * 获取 class path 中的文件流 * @param name 名称 * @return InputStream */ public static InputStream getInputStream(String name){ return Thread.currentThread().getContextClassLoader().getResourceAsStream(name); } }
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <title>HTML to PDF</title> <style type="text/css"> h1 { color:#ccc; } table tr td{ text-align:center; border:1px solid red; padding:4px; color:red; } table tr th{ background-color:#84C7FD; color:#fff; width: 100px; } .itext{ color:#84C7FD; font-weight:bold; } .description{ color:gray; } </style> </head> <body> <h1>HTML to Word</h1> <p> <span class="poi">poi</span> <span class="description">converting HTML to Word</span> </p> <table> <tr> <th class="label">Title</th> <td>iText - Java HTML to PDF</td> <td>iText - Java HTML to PDF</td> <td>iText - Java HTML to PDF</td> </tr> <tr> <th>URL</th> <td>www.apache.org</td> <td>www.apache.org</td> <td>www.apache.org</td> </tr> </table> <img src="http://dl2.iteye.com/upload/attachment/0083/2873/9d920e8c-8f09-395a-986a-e7a49911676c.png"/> </body> </html>
相关推荐
在本案例中,我们关注的是如何使用Apache POI将Word文档转换为HTML格式,并且保持原有的样式、表格和图片。下面我们将详细介绍这个过程中的关键知识点。 1. **Apache POI简介** Apache POI 提供了Java API,使得...
7. **文档转换**:虽然Apache POI主要用于读写操作,但通过结合其他工具或库,开发者还可以实现Office文件与其他格式之间的转换,比如PDF、HTML等。 8. **社区支持**:作为Apache项目的一部分,Apache POI拥有活跃...
Apache POI的主要功能是将Java对象转换为Microsoft Office文件格式,以便于在Java应用程序中生成和处理Office文件。 在生成Word文档时,Apache POI提供了XWPFDocument类,用于创建和操作Word文档。通过XWPFDocument...
- **Utils**:包含Apache POI相关的工具类,封装读写操作,处理文件I/O和数据转换。 - **Resources**:存放Excel模板或样例文件。 综上所述,Apache POI for Android 提供了一套完整的解决方案,让开发者能够在...
本主题聚焦于如何利用Apache POI库将Word文档转换为HTML格式,从而实现在线阅读。Apache POI是一个强大的开源Java库,它允许开发者读取、写入以及创建Microsoft Office格式的文件,包括Word(.doc)文档。 首先,让...
在本案例中,我们将关注如何使用Apache POI来读取Word文档的内容,并将其以流的形式返回到Web应用程序的前端页面。 首先,Apache POI提供了一个名为`XWPFDocument`的类,用于处理`.docx`格式的Word文档。这个类允许...
本文将深入探讨如何利用Apache POI框架根据模板生成Word文档,并进一步将其转换为PDF文件。 首先,Apache POI提供了一个名为HWPF(Horrible Word Processor Format)的组件,用于处理Word文档。通过这个组件,我们...
在实际应用中,Apache POI 的功能不仅限于简单的读写操作,还支持复杂的格式转换、样式调整和模板填充等功能,是 Java 开发者处理 Word 文件的强大工具。然而,需要注意的是,由于 `.doc` 文件格式的复杂性,处理...
知识点:使用Apache POI将Word转换为HTML 一、Apache POI简介: Apache POI是Apache软件基金会的Jakarta项目中的一个子项目,它提供了一组API,用于处理Microsoft Office格式的文件,如DOCX、XLSX和PPTX等。其中,...
Apache POI 提供了一种强大的方式来处理Office文档,包括将它们转换为HTML格式。虽然这个过程可能涉及到复杂的元素转换和格式保留,但通过熟练使用POI库,可以构建出高效且功能丰富的转换工具。
如何将word通过POI转化为html并保留其原有格式;如何删除多余的空白行。 阅读建议:此资源以SpringBoot为底层技术框架,结合POI对word文档进行操作,学习其实现原理和内核,不仅是代码编写实现也更注重内容上的需求...
下面我们将详细讨论如何使用Apache POI和iTextPDF这两个库来完成Word到PDF的转换。 Apache POI是一个流行的Java库,用于读写Microsoft Office格式的文件,包括Word(.doc和.docx)。它提供了低级API(HSSF和XSSF)...
在这个场景中,我们将重点讨论如何使用Java POI库将Word文档转换为HTML格式,并确保这种转换对Microsoft Word 2003(.doc)和2007(.docx)版本都兼容。 首先,我们需要引入Apache POI库到Java项目中。这可以通过...
标题中的“poi将word、PPT、Excel转pdf实现在线预览的jar包”涉及到的是Apache POI库在Java开发中的应用,以及如何利用它来处理Microsoft Office文档并转换为PDF格式,以便进行在线预览。Apache POI是Java平台上用于...
本篇文章将详细讲解如何利用Apache POI库来读取Excel数据并将其写入到Word文档中。 首先,我们需要了解Apache POI的基本概念。POI提供了一组API,允许程序员在Java应用程序中创建、修改和显示这些文件。对于Excel...
POI中中关于word的各种操作都在这里,将数据导入方便转换!
Java中的Apache POI库是一个强大的工具,用于读取、创建...总之,Apache POI使得在Java中处理Word文档变得容易,包括将Word文档转换为HTML。这种转换在许多场景下都有应用,如网站内容发布、数据迁移或报告自动化生成。