在Java世界,要想生成PDF,方案不少。最近一直在和这个东西打交道,所以简单做一个小结吧。
在此之前,先来勾画一下我心中比较
理想的一个解决方案。在企业应用中,碰到的比较多的PDF的需求,可能是针对某个比较典型的具备文档特性的内
容,导出成为PDF进行存档。由于我们现在往往使用一些开源框架,诸如ssh来构建我们的应用,所以我们相对熟悉的方案是针对具体的业务逻辑设计实体,使
用开源框架来实现我们的业务逻辑。而PDF的导出,最好不要破坏现有的程序框架,甚至能复用我们业务逻辑层的代码。
因 为如果把PDF作为一种特殊的表现形式的话,实际上它有点类似模板。最佳的情况, 是我们能够通过编写某种模板,把PDF的大概样子确定下来,然后把数据和模板做一次整合,得到最后的结果
带着这个目标,开始在网上搜索解决方案。也找到了一些方案,下面简单小结一下:
Jasper Report
看到的市面上采用的最多的方案,是Jasper Report。相关的文档也很多,不过很杂,需要完全掌握,我认为还是有些坡度和时间的。这个时间和坡度我认为主要来自于对iReport这个IDE的反 复尝试,对里面的每个属性的摸索。
Jasper
Report的设计思路,本身是不违反我上面所说的初衷的。因为我们的努力方向是先生成模板,然后得到数据,最后将两者整合得到结果。但是Jasper
Report的问题在于,其生成模板的方式过于复杂,即使有IDE的帮助,我们还是需要对其中的众多规则有所了解才行,否则就会给调试带来极大的麻烦。
所以,我认为Jasper Report是一个半调子方案,这种强依赖于IDE进行可视化编辑的方式令我很不爽。同时,由此带来的诸多的限制,相信也让很多使用者颇为头疼。在经历了 一番痛苦的挣扎后,决定放弃使用这种方案。
iText
其
实Jasper
Report是基于iText的。于是有的人会说,那么直接使用iText不是一种倒退么?的确,直接使用iText似乎就需要直接使用原生的API进行
编程了。不过幸好iText其实提供了一些方便的API,通过使用这些API,我们可以直接将HTML代码转化成iText可识别的Document对
象,从而导出PDF文档。
-
import
java.io.FileOutputStream;
-
import
java.io.FileReader;
-
import
java.util.ArrayList;
-
-
import
com.lowagie.text.Document;
-
import
com.lowagie.text.Element;
-
import
com.lowagie.text.html.simpleparser.HTMLWorker;
-
import
com.lowagie.text.html.simpleparser.StyleSheet;
-
import
com.lowagie.text.pdf.PdfWriter;
-
-
public
class
MainClass {
-
public
static
void
main(String[] args)
throws
Exception {
-
Document document = new
Document();
-
StyleSheet st = new
StyleSheet();
-
st.loadTagStyle("body"
,
"leading"
,
"16,0"
);
-
PdfWriter.getInstance(document, new
FileOutputStream(
"html2.pdf"
));
-
document.open();
-
ArrayList p = HTMLWorker.parseToList(new
FileReader(
"example.html"
), st);
-
for
(
int
k =
0
; k < p.size(); ++k)
-
document.add((Element) p.get(k));
-
document.close();
-
}
-
}
import java.io.FileOutputStream; import java.io.FileReader; import java.util.ArrayList; import com.lowagie.text.Document; import com.lowagie.text.Element; import com.lowagie.text.html.simpleparser.HTMLWorker; import com.lowagie.text.html.simpleparser.StyleSheet; import com.lowagie.text.pdf.PdfWriter; public class MainClass { public static void main(String[] args) throws Exception { Document document = new Document(); StyleSheet st = new StyleSheet(); st.loadTagStyle("body", "leading", "16,0"); PdfWriter.getInstance(document, new FileOutputStream("html2.pdf")); document.open(); ArrayList p = HTMLWorker.parseToList(new FileReader("example.html"), st); for (int k = 0; k < p.size(); ++k) document.add((Element) p.get(k)); document.close(); } }
这是从网上找到的一个例子。从代码中,我们可以看到,iText本身提供了一个简单的HTML的解析器,它可以把HTML转化成我们需要的PDF 的document。
有
了这个东西,基本上我的目标就能达成一大半了。接下来我的任务就是根据实际情况去编写HTML代码,然后扔进这个方法,就OK了。而真正的
HTML代码,我们则可以在这里使用真正的模板技术,Freemarker或者Velocity去生成我们所需要的内容。当然,这已经是我们熟门熟路的东
西了。
正当我觉得这个方案基本能符合我的要求的时候,我也同样找到了它的很多弱项:
1. 无法识别很多HTML的tag和attribute(应该是iText的HTMLParser不够强大)
2. 无法识别CSS
如果说第一点我还可以勉强接受的话,那么第二点我就完全不能接受了。无法识别简单的CSS,就意味着HTML失去了最基本的活力,也无法根据实际 要求调整样式。
所以这种方案也必然无法成为我的方案。
flying sauser
在这种情况下,我几乎已经燃起了自己编写一个支持CSS解析的HTML Parser的想法。幸好,在一个非常偶然的情况下,我在google中搜到了这样一个开源项目,它能够满足我的一切需求。这就是flying sauser,项目主页是:https://xhtmlrenderer.dev.java.net/
项目的首页非常吸引人:An XML/XHTML/CSS 2.1 Renderer
。这不正是我要的东西么?
仔细再看里面的文档:
引用
Flying
Saucer is an XML/CSS renderer, which means it takes XML files as input,
applies formatting and styling using CSS, and generates a rendered
representation of that XML as output. The output may go to the screen
(in a GUI), to an image, or to a PDF file. Because we believe most
people will be interested in re-using their knowledge of web layout,
our main target for content is XHTML 1.0 (strict), an XML document
format that standardizes HTML.
完美了。这东西能解析HTML和CSS,而且能输出成image,PDF等格式。哇!我们来看看sample代码(代码丑陋,不过已经能说明问题 了):
-
/*
-
* ITextRendererTest.java *
-
* Copyright 2009 Shanghai TuDou.
-
* All rights reserved.
-
*/
-
-
package
itext;
-
-
import
java.io.File;
-
import
java.io.FileOutputStream;
-
import
java.io.OutputStream;
-
-
import
org.xhtmlrenderer.pdf.ITextFontResolver;
-
import
org.xhtmlrenderer.pdf.ITextRenderer;
-
-
import
com.lowagie.text.pdf.BaseFont;
-
-
/**
-
* TODO class description *
-
*
-
* @author pcwang
-
*
-
* @version 1.0, 上 午11:03:26 create $Id$
-
*/
-
public
class
ITextRendererTest {
-
public
static
void
main(String[] args)
throws
Exception {
-
String inputFile = "conf/template/test.html"
;
-
String url = new
File(inputFile).toURI().toURL().toString();
-
String outputFile = "firstdoc.pdf"
;
-
OutputStream os = new
FileOutputStream(outputFile);
-
ITextRenderer renderer = new
ITextRenderer();
-
renderer.setDocument(url);
-
-
// 解决中文支持问题
-
ITextFontResolver fontResolver = renderer.getFontResolver();
-
fontResolver.addFont("C:/Windows/Fonts/arialuni.ttf"
, BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED);
-
-
// 解决图片的相对路径问题
-
renderer.getSharedContext().setBaseURL("file:/D:/Work/Demo2do/Yoda/branch/Yoda%20-%20All/conf/template/"
);
-
-
renderer.layout();
-
renderer.createPDF(os);
-
-
os.close();
-
}
-
}
/* * ITextRendererTest.java * * Copyright 2009 Shanghai TuDou. * All rights reserved. */ package itext; import java.io.File; import java.io.FileOutputStream; import java.io.OutputStream; import org.xhtmlrenderer.pdf.ITextFontResolver; import org.xhtmlrenderer.pdf.ITextRenderer; import com.lowagie.text.pdf.BaseFont; /** * TODO class description * * * @author pcwang * * @version 1.0, 上午11:03:26 create $Id$ */ public class ITextRendererTest { public static void main(String[] args) throws Exception { String inputFile = "conf/template/test.html"; String url = new File(inputFile).toURI().toURL().toString(); String outputFile = "firstdoc.pdf"; OutputStream os = new FileOutputStream(outputFile); ITextRenderer renderer = new ITextRenderer(); renderer.setDocument(url); // 解决中文支持问题 ITextFontResolver fontResolver = renderer.getFontResolver(); fontResolver.addFont("C:/Windows/Fonts/arialuni.ttf", BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED); // 解决图片的相对路径问题 renderer.getSharedContext().setBaseURL("file:/D:/Work/Demo2do/Yoda/branch/Yoda%20-%20All/conf/template/"); renderer.layout(); renderer.createPDF(os); os.close(); } }
运行,成功!实在太简单了!API帮你完成了一切!
有了这个东西,我们就可以将PDF的生成流程变成这样:
1) 编写Freemarker或者Velocity模板,打造HTML,勾画PDF的样式(请任意使用CSS)
2) 在你的业务逻辑层引入Freemarker的引擎或者Velocity的引擎,并将业务逻辑层中可以获取的数据和模板,使用引擎生成最终的内容
3) 将我上面的sample代码做简单封装后,调用,生成PDF
这样,我想作为一个web程序员来说,上面的3点,都不会成为你的绊脚石。你可以轻松驾驭PDF了。
在Flying Saucer的官方文档中,有一些Q&A,可以解决读者们大部分的问题。包括PDF的字体、PDF的格式、Image如何处理等等。大家可以尝试 着去阅读。
还有一篇文章,好像是作者写的,非常不错:http://today.java.net/pub/a/today/2007/06/26/generating-pdfs-with-flying-saucer-and-itext.html
分享到:
相关推荐
**iText PDF生成方案** iText是一个开源的Java库,专门用于创建和修改PDF文档。在IT领域,尤其是在文档处理和报告生成方面,iText是一个非常实用的工具。本方案将详细探讨如何利用iText来生成PDF文件,以及相关的...
首先,我们需要一个PDF库,它能够运行在资源有限的MCU上。虽然PDF格式复杂,但有一些轻量级的开源库如`PDFGen`可以帮助我们实现这一目标。根据提供的压缩包包名`PDFGen-master`,我们可以假设这是我们要用的库,它...
1、 pdfWriter1():使用QpdfWriter和Qpainter进行纯文字版的pdf生成和绘制,并进行了分页显示。 Pdf生成在当前目录下的pdf_test.pdf 2、 pdfWriter2():使用QPdfwriter 和QPainter创建pdf报告,关键是对页面的布局...
Excel是Microsoft Office套件中的一个核心组件,主要用于创建和编辑电子表格,而PDF(Portable Document Format)则是一种通用的文件格式,用于保持文档的原始布局和样式,便于共享和打印。本篇文章将深入探讨如何...
PDF生成缩略图是将PDF文档中的页面转换成小尺寸的图像表示,通常用于预览、索引或在文件管理器中快速查看PDF内容。在IT领域,这涉及到PDF处理和图像处理技术。以下是一些关于如何在C#中生成PDF缩略图的关键知识点: ...
10. **实战示例**:下面是一个使用Apache PDFBox进行PDF转图片的简单代码示例: ```java import org.apache.pdfbox.pdmodel.PDDocument; import org.apache.pdfbox.rendering.ImageType; import org.apache.pdfbox....
标题“自动生成PDF文件,C#源码”表明我们讨论的是一个使用C#编程语言创建PDF文件的解决方案。这通常涉及到第三方库的使用,如iTextSharp,它是一个强大的PDF处理库,能够帮助开发者在C#环境中方便地生成、编辑和...
本项目提供了一个纯Java实现的解决方案,它能有效地完成多个PDF文件的合并,并且支持自定义目录的生成以及页码的添加。 首先,`PDFUtil.java`是这个项目的核心类,它包含了处理PDF的关键方法。PDFUtil可能包含了...
此外,PDF生成器还可能提供一些高级特性,如合并多个文件为一个PDF、添加水印、密码保护等,以满足不同用户的需求。 总的来说,PDF生成器是Windows 7用户便捷创建PDF文档的重要工具。通过理解其工作原理和使用方法...
接下来,我们讨论`reportlab`库,它是一个强大的Python PDF生成库。通过`reportlab`,你可以直接在Python代码中创建PDF文档,而无需HTML作为中间格式。以下是一个简单的示例,展示如何使用`reportlab`创建一个包含...
在`demoPDF`示例中,我们可以看到一个实际的应用案例,它展示了如何配置`flying-saucer-pdf`来处理图片和中文问题。通过分析和调试这个示例,开发者可以更好地理解如何在自己的项目中应用这些解决方案。 总的来说,...
总的来说,这款包含注册码的PDF生成器提供了一个便捷的解决方案,帮助用户轻松创建和管理PDF文档。其小巧的体积、简单的操作以及全面的功能使得它成为处理PDF文件的理想选择。用户在享受这些服务的同时,也无需担心...
本文主要介绍了一种保护数据隐私的深度学习训练数据生成方案,该方案基于条件生成对抗网络(CGAN),能够生成大量与真实数据同分布的对抗样本,满足了生成大量带标签训练数据的需求。同时,该方案还结合数据变形方法...
总的来说,这款“多图片生成一PDF工具”提供了一个简单易用且高效的解决方案,帮助用户快速将图片集合整理成PDF文档,特别适合处理jpg、png和bmp格式的图片。同时,其批量处理功能极大地提升了处理大量图片的效率。...
虽然.NET Framework本身并不直接支持PDF生成,但有许多开源和商业库可供选择,如iTextSharp、PDFsharp、Syncfusion Essential PDF等。这些库提供了API,允许开发者创建、编辑和操作PDF文档。 以iTextSharp为例,这...
本项目“android_HTML转PDF”提供了一个解决方案,它支持中文字符显示以及单独处理图片的功能。以下是对这个项目的详细解析: 1. **HTML与PDF的转换原理** HTML是一种标记语言,用于创建和展示网页内容,而PDF...
总之,"简单易用的pdf生成器"通过DOPDF提供了一个便捷的解决方案,使得用户能够快速且轻松地将Word文档转换为PDF,确保内容的准确性和安全性。通过掌握这种工具的使用,无论是个人还是专业人士,都能在日常工作中...
在生成PDF时,我们可以借助Flying Saucer库,这是一个能够将HTML转换为PDF的工具。通过将Freemarker模板与Flying Saucer结合,可以方便地将动态数据转换成结构化的PDF文档。例如,你可以创建一个Freemarker模板,...
php生成pdf的完全解决方案,不使用phplib插件,完全脚本化执行,完美解决中文乱码问题,支持以下功能: 1、完美支持中文,php生成的pdf不会出现乱码 2、把SQL查询结构生成为pdf中的表格 3、pdf页眉页脚支持中文及...
首先,我们需要一个库来处理PDF生成。一个常用的开源库是iTextSharp,它是一个功能丰富的PDF处理库,支持多种操作,包括创建、编辑和读取PDF文件。要使用iTextSharp,你需要在项目中添加对它的引用。可以通过NuGet包...