`
huangronaldo
  • 浏览: 222607 次
  • 性别: Icon_minigender_1
社区版块
存档分类
最新评论

Java HTML直接导出PDF

阅读更多

Java  HTML直接导出PDF

对于java中如何从html中直接导出pdf,有很多的开源代码,这里个人用itext转。

首先需要的包有:core-renderer-1.0.jar

core-renderer-R8pre1.jar

core-renderer.jar

iText-2.0.8.jar

jtidy-4aug2000r7-dev.jar

Tidy.jar

iTextAsian.jar

java代码的话就比较简单了。具体是先用Tidy将html转换为xhtml,将xhtml转换为其它各种格式的。虽然在转化到pdf时也是用的iText。代码如下:

	//struts1.x中
else if("Html2Pdf".equalsIgnoreCase(action)){
	exportPdfFile("http://localhost:8080/jsp/test.jsp");
	return null;
}

// 导出pdf add by huangt 2012.6.1
	public File exportPdfFile(String urlStr) throws BaseException {
		// String outputFile = this.fileRoot + "/" +
		// ServiceConstants.DIR_PUBINFO_EXPORT + "/" + getFileName() + ".pdf";
		String outputFile = "d:/test3.pdf";
		OutputStream os;
		try {
			os = new FileOutputStream(outputFile);

			ITextRenderer renderer = new ITextRenderer();

			String str = getHtmlFile(urlStr);
			renderer.setDocumentFromString(str);
			ITextFontResolver fontResolver = renderer.getFontResolver();
			
			fontResolver.addFont("C:/WINDOWS/Fonts/SimSun.ttc",BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED);// 宋体字
			fontResolver.addFont("C:/WINDOWS/Fonts/Arial.ttf",BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED);// 宋体字
			renderer.layout();

			renderer.createPDF(os);

			System.out.println("转换成功!");
			os.flush();
			os.close();
			return new File(outputFile);
		} catch (FileNotFoundException e) {
			// logger.error("不存在文件!" + e.getMessage());
			throw new BaseException(e);
		} catch (DocumentException e) {
			// logger.error("生成pdf时出错了!" + e.getMessage());
			throw new BaseException(e);
		} catch (IOException e) {
			// logger.error("pdf出错了!" + e.getMessage());
			throw new BaseException(e);
		}

	}

	// 读取页面内容 add by huangt 2012.6.1
	public String getHtmlFile(String urlStr) throws BaseException {
		URL url;
		try {
			if (urlStr.indexOf("?") != -1) {
				urlStr = urlStr + "&locale="
						+ LocaleContextHolder.getLocale().toString();
			} else {
				urlStr = urlStr + "?locale="
						+ LocaleContextHolder.getLocale().toString();
			}
			url = new URL(urlStr);

			URLConnection uc = url.openConnection();
			InputStream is = uc.getInputStream();
			
			Tidy tidy = new Tidy();

			OutputStream os2 = new ByteArrayOutputStream();
			tidy.setXHTML(true); // 设定输出为xhtml(还可以输出为xml)
			tidy.setCharEncoding(Configuration.UTF8); // 设定编码以正常转换中文
			tidy.setTidyMark(false); // 不设置它会在输出的文件中给加条meta信息
			tidy.setXmlPi(true); // 让它加上<?xml version="1.0"?>
			tidy.setIndentContent(true); // 缩进,可以省略,只是让格式看起来漂亮一些
			tidy.parse(is, os2);

			is.close();

			// 解决乱码 --将转换后的输出流重新读取改变编码
			String temp;
			StringBuffer sb = new StringBuffer();
			BufferedReader in = new BufferedReader(new InputStreamReader(
					new ByteArrayInputStream(
							((ByteArrayOutputStream) os2).toByteArray()),
					"utf-8"));
			while ((temp = in.readLine()) != null) {
				sb.append(temp);
			}

			return sb.toString();
		} catch (IOException e) {
			// logger.error("读取客户端网页文本信息时出错了" + e.getMessage());
			throw new BaseException(e);
		}

	}

 

为了解决包的问题,加上Maven <!-- pdf导出 -->

			<dependency>
				<groupId>com.lowagie</groupId>
				<artifactId>itext</artifactId>
				<version>2.1.7</version>
			</dependency>
			<dependency>
				<groupId>org.xhtmlrenderer.flyingsaucer</groupId>
				<artifactId>pdf-renderer</artifactId>
				<version>1.0</version>
			</dependency>
			<dependency>
				<groupId>jtidy</groupId>
				<artifactId>jtidy</artifactId>
				<version>4aug2000r7-dev</version>
				<type>jar</type>
				<scope>compile</scope>
			</dependency>
			<dependency>
				<groupId>net.sf.barcode4j</groupId>
				<artifactId>barcode4j-light</artifactId>
				<version>2.0</version>
			</dependency>
			<dependency>
				<groupId>avalon-framework</groupId>
				<artifactId>avalon-framework-impl</artifactId>
				<version>4.2.0</version>
			</dependency>
			<!-- pdf -->
 

另外附上 稍微复杂的PDFUtils.java文件,由于没时间就不做整理解释了!见下载附件!

 

  • Tidy.jar (133.7 KB)
  • 下载次数: 1505
分享到:
评论
8 楼 mazheng34340237 2012-09-23  
真心感谢楼主 省了我很多麻烦的操作
7 楼 huangronaldo 2012-09-20  
ruize 写道
怎么才能支持中文显示

首先要将中文字体包引入fontResolver.addFont("C:/WINDOWS/Fonts/SimSun.ttc",BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED);// 宋体字 
,以上是直接 引用系统 的 C:/WINDOWS/Fonts/SimSun.ttc ,也可以放到项目的相关目录下。
然后是页面上字体必须设为这里引用的字体
6 楼 Computers 2012-09-04  
我也要  发我QQ369640377上 非常感谢
5 楼 Computers 2012-09-04  
我也要  发我QQ上 非常感谢
4 楼 419131433 2012-08-23  
能把这个项目发给我吗,非常感谢。419131433@qq.com
3 楼 ruize 2012-07-30  
怎么才能支持中文显示
2 楼 zwk199024 2012-07-26  
楼主方便把jar包发到我邮箱么 zwk199024@163.com 谢谢
1 楼 pyczh 2012-07-23  
学习一下,
请问能方便把这几个jar包发给我吗?czh84112@163.com
谢谢lz

相关推荐

    Java HTML直接导出PDF需要的包

    Java HTML直接导出PDF需要的包有:core-renderer-1.0.jar core-renderer-R8pre1.jar core-renderer.jar iText-2.0.8.jar jtidy-4aug2000r7-dev.jar Tidy.jar iTextAsian.jar

    java根据模板导出PDF详细教程(包含统计图)

    本文将深入探讨如何使用Java来根据模板导出包含统计图的PDF文档。主要涉及的技术包括iText库、FreeMarker模板引擎以及可能的数据可视化工具。 首先,iText是一个强大的Java库,专门用于创建和操作PDF文档。它提供了...

    java导出docx导出pdf

    Java编程语言在处理文档转换方面提供了强大的支持,...综上所述,"java导出docx导出pdf"的项目提供了一个Java解决方案,通过利用Apache POI和iText库,实现了从Docx到PDF的快速转换,适用于各种需要文档转换的场景。

    java将页面导出PDF.zip

    在这个案例中,"将页面导出PDF.zip"文件可能包含了使用其中一个库的示例代码,特别是Flying Saucer,因为它擅长将HTML内容转换为PDF。 Flying Saucer是一个强大的Java库,它能够解析HTML并将其渲染为PDF、XPS或其他...

    java使用itext导出PDF文本绝对定位(实现方法)

    java使用iText导出PDF文本绝对定位(实现方法) iText是一个流行的Java类库,用于生成PDF文档。下面我们将探讨如何使用iText在Java中导出PDF文本,并实现绝对定位。 iText简介 iText是一个开源的Java类库,用于...

    java实现导出pdf文件

    在Java开发中,导出PDF文件是一项常见的需求,特别是在生成报表、文档或发票等场景下。iText是一个强大的Java库,专门用于创建和修改PDF文档。在这个过程中,我们将深入探讨如何使用iText库来实现从网页(JSP)导出...

    java根据模板导出PDF详细教程(包含统计图).rar

    在本文档中,我们将探讨如何使用Java来根据模板导出包含统计图的PDF文档。主要涉及的技术包括iText库、FreeMarker模板引擎以及可能的数据处理和图形生成。 首先,iText是一个强大的Java库,用于创建和修改PDF文档。...

    Java导出pdf 利用模板导出

    在Java开发中,导出PDF是一项常见的需求,例如生成报告、报表或者合同等。这个话题主要涉及Java处理PDF文档的技术,以及如何利用模板来高效地生成PDF内容。在这个场景下,我们可以使用开源库如iText或Apache PDFBox...

    JAVA导出PDF文件所需相关配置文件

    在Java开发中,导出PDF文件是一项常见的任务,尤其在报表生成、文档创建等领域。PDF(Portable Document Format)因其跨平台、格式保持等特性而被广泛使用。本篇将详细介绍在Java环境下,导出PDF所需的配置文件以及...

    java导出pdf.zip

    Java导出PDF是一种常见的技术需求,特别是在开发报告生成、数据可视化或者文档呈现的场景中。在Java中,我们可以使用各种库来实现将数据导出为PDF格式的功能。本篇文章将详细探讨这一主题。 首先,我们需要了解PDF...

    java导出pdf文件

    在Java编程环境中,导出PDF(Portable Document Format)文件是一项常见的任务,这通常涉及到将数据、文本或图形从应用程序转换成这种广泛支持的格式,以便于分发和打印。PDF文件格式具有跨平台兼容性,可以保留原始...

    java实现HTML页面转PDF亲测好用

    你也可以考虑使用专门为Java设计的HTML转PDF库,如PDFreactor、Flying Saucer或HtmlUnit,它们通常提供更丰富的API和更好的集成。 在实际项目中,你可能需要处理更复杂的情况,比如设置PDF页面大小、自定义CSS样式...

    java+ireport 例子 导出html以及pdf

    java+ireport 例子 导出html以及pdf 可以直接运行,使用的是mysql数据库 DROP TABLE IF EXISTS `t_user`; CREATE TABLE `t_user` ( `id` int(11) NOT NULL AUTO_INCREMENT, `name` varchar(10) DEFAULT NULL, `...

    freemark模板导出PDF

    本篇文章将详细讲解如何利用FreeMarker模板来导出PDF文件。 1. **FreeMarker基本概念** FreeMarker是Java语言的一个模板引擎,它与Spring、Struts等框架结合紧密,允许开发者将逻辑代码与展示层分离,通过模板文件...

    JAVA使用itextpdf实现HTML转PDF

    总之,使用iTextPDF库在Java中实现HTML到PDF的转换是一项实用的技能,但需要注意库对HTML和CSS的支持限制。根据实际需求,可能需要对HTML源码进行调整,或者考虑使用其他兼容性更强的库来实现更丰富的转换效果。

    easypoi的使用demo,包含Excel模板导出,html导出Excel,Excel导出pdf等

    在标题和描述中提到的几个关键功能,我们将详细探讨如何使用Easy POI进行Excel模板导出、HTML导出为Excel以及Excel导出为PDF。 1. Excel模板导出: Easy POI允许开发者使用预定义的Excel模板来导出数据。在模板中...

    PD4ML 实测Java将HTML导出为PDF 成功解决中文乱码问题

    PD4ML是一个Java库,专门用于将HTML内容转换为高质量的PDF文档。本篇将深入探讨如何使用PD4ML实现在Java环境中处理中文乱码问题,并提供相关文件的背景和用途。 首先,我们要理解为何会出现中文乱码。在处理非ASCII...

    itext html导出pdf

    在描述中提到的"itext html导出pdf",通常涉及到以下几个步骤: 1. **HTML解析**:首先,我们需要解析HTML内容。这通常通过第三方库如Jsoup或Apache POI完成,它们能够解析HTML文档并提取所需的数据结构。 2. **...

    thymeleaf框架通过java渲染html生成pdf

    在这个场景中,我们探讨如何利用Thymeleaf与Java技术相结合,生成HTML并进一步转换为PDF文件,以便在浏览器中预览或者下载。这个过程通常应用于生成报告、发票或其他需要以结构化文档形式呈现的数据。 首先,让我们...

Global site tag (gtag.js) - Google Analytics