`

Apache POI将HTML转换成Word

    博客分类:
  • POI
阅读更多

Apache POI将HTML转换成Word

结果图如下:



 

package com.poi.word;

import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.io.OutputStream;

import org.apache.poi.poifs.filesystem.DirectoryEntry;
import org.apache.poi.poifs.filesystem.POIFSFileSystem;

/**
 * HTML 转换 Word
 * @author LGF 2015-01-04
 *
 */
public class HTML2Word {
	public static void main(String[] args) throws Exception {
		//创建 POIFSFileSystem 对象
		POIFSFileSystem poifs = new POIFSFileSystem();  
		//获取DirectoryEntry
        DirectoryEntry directory = poifs.getRoot();  
        //创建输出流
        OutputStream out = new FileOutputStream("src/html_to_word.doc");
        try {
        	//创建文档,1.格式,2.HTML文件输入流
			directory.createDocument("WordDocument", getInputStream("word.html"));
			//写入
			poifs.writeFilesystem(out);
			//释放资源
			out.close();
			System.out.println("success");
		} catch (IOException e) {
			e.printStackTrace();
		}  
	}
	
	/**
	 * 获取 class path 中的文件流
	 * @param name 名称
	 * @return InputStream 
	 */
	public static InputStream getInputStream(String name){
		return Thread.currentThread().getContextClassLoader().getResourceAsStream(name);
	}
}

 

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
<html>
<head>
<title>HTML to PDF</title>
<style type="text/css">
h1 {
  color:#ccc;
}
table tr td{
    text-align:center;
    border:1px solid red;
    padding:4px;
    color:red;
}
table tr th{
    background-color:#84C7FD;
    color:#fff;
    width: 100px;
}
.itext{
    color:#84C7FD;
    font-weight:bold;
}
.description{
    color:gray;
}
</style>
</head>
<body>
	<h1>HTML to Word</h1>
	<p>
		<span class="poi">poi</span> 
		<span class="description">converting HTML to Word</span>
	</p>
	<table>
		<tr>
			<th class="label">Title</th>
			<td>iText - Java HTML to PDF</td>
			<td>iText - Java HTML to PDF</td>
			<td>iText - Java HTML to PDF</td>
		</tr>
		<tr>
			<th>URL</th>
			<td>www.apache.org</td>
			<td>www.apache.org</td>
			<td>www.apache.org</td>
		</tr>
	</table>
	<img src="http://dl2.iteye.com/upload/attachment/0083/2873/9d920e8c-8f09-395a-986a-e7a49911676c.png"/>
</body>
</html>

 

 

 

  • 大小: 25.4 KB
分享到:
评论
1 楼 始如初见llyj 2018-05-16  
亲,我运行出错,您能帮我看看吗?
Exception in thread "main" java.lang.NullPointerException
at org.apache.poi.util.IOUtils.readFully(IOUtils.java:92)
at org.apache.poi.util.IOUtils.readFully(IOUtils.java:77)
at org.apache.poi.poifs.storage.DocumentBlock.<init>(DocumentBlock.java:71)
at org.apache.poi.poifs.filesystem.POIFSDocument.<init>(POIFSDocument.java:158)
at org.apache.poi.poifs.filesystem.POIFSDocument.<init>(POIFSDocument.java:182)
at org.apache.poi.poifs.filesystem.DirectoryNode.createDocument(DirectoryNode.java:414)
at aa.HTML2Word.main(HTML2Word.java:27)


27行是   directory.createDocument("WordDocument", getInputStream("word.html"));

相关推荐

    poi将word转换成html、样式 表格 图片处理

    在本案例中,我们关注的是如何使用Apache POI将Word文档转换为HTML格式,并且保持原有的样式、表格和图片。下面我们将详细介绍这个过程中的关键知识点。 1. **Apache POI简介** Apache POI 提供了Java API,使得...

    Apache POI资源包

    7. **文档转换**:虽然Apache POI主要用于读写操作,但通过结合其他工具或库,开发者还可以实现Office文件与其他格式之间的转换,比如PDF、HTML等。 8. **社区支持**:作为Apache项目的一部分,Apache POI拥有活跃...

    利用Java Apache POI 生成Word文档示例代码

    Apache POI的主要功能是将Java对象转换为Microsoft Office文件格式,以便于在Java应用程序中生成和处理Office文件。 在生成Word文档时,Apache POI提供了XWPFDocument类,用于创建和操作Word文档。通过XWPFDocument...

    Apache POI for Android

    - **Utils**:包含Apache POI相关的工具类,封装读写操作,处理文件I/O和数据转换。 - **Resources**:存放Excel模板或样例文件。 综上所述,Apache POI for Android 提供了一套完整的解决方案,让开发者能够在...

    利用POI将word转换成html实现在线阅读

    本主题聚焦于如何利用Apache POI库将Word文档转换为HTML格式,从而实现在线阅读。Apache POI是一个强大的开源Java库,它允许开发者读取、写入以及创建Microsoft Office格式的文件,包括Word(.doc)文档。 首先,让...

    apache poi读取word内容

    在本案例中,我们将关注如何使用Apache POI来读取Word文档的内容,并将其以流的形式返回到Web应用程序的前端页面。 首先,Apache POI提供了一个名为`XWPFDocument`的类,用于处理`.docx`格式的Word文档。这个类允许...

    使用poi根据模版生成word文档并转换成PDF文件

    本文将深入探讨如何利用Apache POI框架根据模板生成Word文档,并进一步将其转换为PDF文件。 首先,Apache POI提供了一个名为HWPF(Horrible Word Processor Format)的组件,用于处理Word文档。通过这个组件,我们...

    java Apache poi 对word doc文件进行读写操作

    在实际应用中,Apache POI 的功能不仅限于简单的读写操作,还支持复杂的格式转换、样式调整和模板填充等功能,是 Java 开发者处理 Word 文件的强大工具。然而,需要注意的是,由于 `.doc` 文件格式的复杂性,处理...

    poi完美word转html

    知识点:使用Apache POI将Word转换为HTML 一、Apache POI简介: Apache POI是Apache软件基金会的Jakarta项目中的一个子项目,它提供了一组API,用于处理Microsoft Office格式的文件,如DOCX、XLSX和PPTX等。其中,...

    使用POI将office(doc/docx/ppt/pptx/xls/xlsx)文件转html格式

    Apache POI 提供了一种强大的方式来处理Office文档,包括将它们转换为HTML格式。虽然这个过程可能涉及到复杂的元素转换和格式保留,但通过熟练使用POI库,可以构建出高效且功能丰富的转换工具。

    Java+SpringBoot+POI进行word2html转换

    如何将word通过POI转化为html并保留其原有格式;如何删除多余的空白行。 阅读建议:此资源以SpringBoot为底层技术框架,结合POI对word文档进行操作,学习其实现原理和内核,不仅是代码编写实现也更注重内容上的需求...

    利用poi+itextpdf进行word转pdf.rar

    下面我们将详细讨论如何使用Apache POI和iTextPDF这两个库来完成Word到PDF的转换。 Apache POI是一个流行的Java库,用于读写Microsoft Office格式的文件,包括Word(.doc和.docx)。它提供了低级API(HSSF和XSSF)...

    java+poi实现word转换html兼容03和07

    在这个场景中,我们将重点讨论如何使用Java POI库将Word文档转换为HTML格式,并确保这种转换对Microsoft Word 2003(.doc)和2007(.docx)版本都兼容。 首先,我们需要引入Apache POI库到Java项目中。这可以通过...

    poi将word、PPT、Excel转pdf实现在线预览的jar包

    标题中的“poi将word、PPT、Excel转pdf实现在线预览的jar包”涉及到的是Apache POI库在Java开发中的应用,以及如何利用它来处理Microsoft Office文档并转换为PDF格式,以便进行在线预览。Apache POI是Java平台上用于...

    利用POI读取excel写入到word

    本篇文章将详细讲解如何利用Apache POI库来读取Excel数据并将其写入到Word文档中。 首先,我们需要了解Apache POI的基本概念。POI提供了一组API,允许程序员在Java应用程序中创建、修改和显示这些文件。对于Excel...

    apache poi word的各种操作

    POI中中关于word的各种操作都在这里,将数据导入方便转换!

    java使用poi将word文档转为html

    Java中的Apache POI库是一个强大的工具,用于读取、创建...总之,Apache POI使得在Java中处理Word文档变得容易,包括将Word文档转换为HTML。这种转换在许多场景下都有应用,如网站内容发布、数据迁移或报告自动化生成。

Global site tag (gtag.js) - Google Analytics