Java HTML直接导出PDF
对于java中如何从html中直接导出pdf,有很多的开源代码,这里个人用itext转。
首先需要的包有:core-renderer-1.0.jar
core-renderer-R8pre1.jar
core-renderer.jar
iText-2.0.8.jar
jtidy-4aug2000r7-dev.jar
Tidy.jar
iTextAsian.jar
java代码的话就比较简单了。具体是先用Tidy将html转换为xhtml,将xhtml转换为其它各种格式的。虽然在转化到pdf时也是用的iText。代码如下:
- //struts1.x中
- else if("Html2Pdf".equalsIgnoreCase(action)){
- exportPdfFile("http://localhost:8080/jsp/test.jsp");
- return null;
- }
- // 导出pdf add by huangt 2012.6.1
- public File exportPdfFile(String urlStr) throws BaseException {
- // String outputFile = this.fileRoot + "/" +
- // ServiceConstants.DIR_PUBINFO_EXPORT + "/" + getFileName() + ".pdf";
- String outputFile = "d:/test3.pdf";
- OutputStream os;
- try {
- os = new FileOutputStream(outputFile);
- ITextRenderer renderer = new ITextRenderer();
- String str = getHtmlFile(urlStr);
- renderer.setDocumentFromString(str);
- ITextFontResolver fontResolver = renderer.getFontResolver();
- fontResolver.addFont("C:/WINDOWS/Fonts/SimSun.ttc",BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED);// 宋体字
- fontResolver.addFont("C:/WINDOWS/Fonts/Arial.ttf",BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED);// 宋体字
- renderer.layout();
- renderer.createPDF(os);
- System.out.println("转换成功!");
- os.flush();
- os.close();
- return new File(outputFile);
- } catch (FileNotFoundException e) {
- // logger.error("不存在文件!" + e.getMessage());
- throw new BaseException(e);
- } catch (DocumentException e) {
- // logger.error("生成pdf时出错了!" + e.getMessage());
- throw new BaseException(e);
- } catch (IOException e) {
- // logger.error("pdf出错了!" + e.getMessage());
- throw new BaseException(e);
- }
- }
- // 读取页面内容 add by huangt 2012.6.1
- public String getHtmlFile(String urlStr) throws BaseException {
- URL url;
- try {
- if (urlStr.indexOf("?") != -1) {
- urlStr = urlStr + "&locale="
- + LocaleContextHolder.getLocale().toString();
- } else {
- urlStr = urlStr + "?locale="
- + LocaleContextHolder.getLocale().toString();
- }
- url = new URL(urlStr);
- URLConnection uc = url.openConnection();
- InputStream is = uc.getInputStream();
- Tidy tidy = new Tidy();
- OutputStream os2 = new ByteArrayOutputStream();
- tidy.setXHTML(true); // 设定输出为xhtml(还可以输出为xml)
- tidy.setCharEncoding(Configuration.UTF8); // 设定编码以正常转换中文
- tidy.setTidyMark(false); // 不设置它会在输出的文件中给加条meta信息
- tidy.setXmlPi(true); // 让它加上<?xml version="1.0"?>
- tidy.setIndentContent(true); // 缩进,可以省略,只是让格式看起来漂亮一些
- tidy.parse(is, os2);
- is.close();
- // 解决乱码 --将转换后的输出流重新读取改变编码
- String temp;
- StringBuffer sb = new StringBuffer();
- BufferedReader in = new BufferedReader(new InputStreamReader(
- new ByteArrayInputStream(
- ((ByteArrayOutputStream) os2).toByteArray()),
- "utf-8"));
- while ((temp = in.readLine()) != null) {
- sb.append(temp);
- }
- return sb.toString();
- } catch (IOException e) {
- // logger.error("读取客户端网页文本信息时出错了" + e.getMessage());
- throw new BaseException(e);
- }
- }
为了解决包的问题,加上Maven <!-- pdf导出 -->
- <dependency>
- <groupId>com.lowagie</groupId>
- <artifactId>itext</artifactId>
- <version>2.1.7</version>
- </dependency>
- <dependency>
- <groupId>org.xhtmlrenderer.flyingsaucer</groupId>
- <artifactId>pdf-renderer</artifactId>
- <version>1.0</version>
- </dependency>
- <dependency>
- <groupId>jtidy</groupId>
- <artifactId>jtidy</artifactId>
- <version>4aug2000r7-dev</version>
- <type>jar</type>
- <scope>compile</scope>
- </dependency>
- <dependency>
- <groupId>net.sf.barcode4j</groupId>
- <artifactId>barcode4j-light</artifactId>
- <version>2.0</version>
- </dependency>
- <dependency>
- <groupId>avalon-framework</groupId>
- <artifactId>avalon-framework-impl</artifactId>
- <version>4.2.0</version>
- </dependency>
- <!-- pdf -->
另外附上 稍微复杂的PDFUtils.java文件,由于没时间就不做整理解释了!见下载附件!
相关推荐
在IT行业中,将HTML内容直接导出为PDF是一种常见的需求,尤其在报表生成、文档打印或者网络内容保存等方面。这个话题涉及到Java编程语言以及相关的库和技术。本文将深入讲解如何利用Java来实现这一功能,主要关注`...
Java HTML直接导出PDF需要的包有:core-renderer-1.0.jar core-renderer-R8pre1.jar core-renderer.jar iText-2.0.8.jar jtidy-4aug2000r7-dev.jar Tidy.jar iTextAsian.jar
本文将深入探讨如何使用Java来根据模板导出包含统计图的PDF文档。主要涉及的技术包括iText库、FreeMarker模板引擎以及可能的数据可视化工具。 首先,iText是一个强大的Java库,专门用于创建和操作PDF文档。它提供了...
Java编程语言在处理文档转换方面提供了强大的支持,...综上所述,"java导出docx导出pdf"的项目提供了一个Java解决方案,通过利用Apache POI和iText库,实现了从Docx到PDF的快速转换,适用于各种需要文档转换的场景。
在这个案例中,"将页面导出PDF.zip"文件可能包含了使用其中一个库的示例代码,特别是Flying Saucer,因为它擅长将HTML内容转换为PDF。 Flying Saucer是一个强大的Java库,它能够解析HTML并将其渲染为PDF、XPS或其他...
java使用iText导出PDF文本绝对定位(实现方法) iText是一个流行的Java类库,用于生成PDF文档。下面我们将探讨如何使用iText在Java中导出PDF文本,并实现绝对定位。 iText简介 iText是一个开源的Java类库,用于...
在Java开发中,导出PDF文件是一项常见的需求,特别是在生成报表、文档或发票等场景下。iText是一个强大的Java库,专门用于创建和修改PDF文档。在这个过程中,我们将深入探讨如何使用iText库来实现从网页(JSP)导出...
在本文档中,我们将探讨如何使用Java来根据模板导出包含统计图的PDF文档。主要涉及的技术包括iText库、FreeMarker模板引擎以及可能的数据处理和图形生成。 首先,iText是一个强大的Java库,用于创建和修改PDF文档。...
在Java开发中,导出PDF是一项常见的需求,例如生成报告、报表或者合同等。这个话题主要涉及Java处理PDF文档的技术,以及如何利用模板来高效地生成PDF内容。在这个场景下,我们可以使用开源库如iText或Apache PDFBox...
在Java开发中,导出PDF文件是一项常见的任务,尤其在报表生成、文档创建等领域。PDF(Portable Document Format)因其跨平台、格式保持等特性而被广泛使用。本篇将详细介绍在Java环境下,导出PDF所需的配置文件以及...
Java导出PDF是一种常见的技术需求,特别是在开发报告生成、数据可视化或者文档呈现的场景中。在Java中,我们可以使用各种库来实现将数据导出为PDF格式的功能。本篇文章将详细探讨这一主题。 首先,我们需要了解PDF...
在Java编程环境中,导出PDF(Portable Document Format)文件是一项常见的任务,这通常涉及到将数据、文本或图形从应用程序转换成这种广泛支持的格式,以便于分发和打印。PDF文件格式具有跨平台兼容性,可以保留原始...
你也可以考虑使用专门为Java设计的HTML转PDF库,如PDFreactor、Flying Saucer或HtmlUnit,它们通常提供更丰富的API和更好的集成。 在实际项目中,你可能需要处理更复杂的情况,比如设置PDF页面大小、自定义CSS样式...
java+ireport 例子 导出html以及pdf 可以直接运行,使用的是mysql数据库 DROP TABLE IF EXISTS `t_user`; CREATE TABLE `t_user` ( `id` int(11) NOT NULL AUTO_INCREMENT, `name` varchar(10) DEFAULT NULL, `...
本篇文章将详细讲解如何利用FreeMarker模板来导出PDF文件。 1. **FreeMarker基本概念** FreeMarker是Java语言的一个模板引擎,它与Spring、Struts等框架结合紧密,允许开发者将逻辑代码与展示层分离,通过模板文件...
总之,使用iTextPDF库在Java中实现HTML到PDF的转换是一项实用的技能,但需要注意库对HTML和CSS的支持限制。根据实际需求,可能需要对HTML源码进行调整,或者考虑使用其他兼容性更强的库来实现更丰富的转换效果。
在标题和描述中提到的几个关键功能,我们将详细探讨如何使用Easy POI进行Excel模板导出、HTML导出为Excel以及Excel导出为PDF。 1. Excel模板导出: Easy POI允许开发者使用预定义的Excel模板来导出数据。在模板中...
PD4ML是一个Java库,专门用于将HTML内容转换为高质量的PDF文档。本篇将深入探讨如何使用PD4ML实现在Java环境中处理中文乱码问题,并提供相关文件的背景和用途。 首先,我们要理解为何会出现中文乱码。在处理非ASCII...
在描述中提到的"itext html导出pdf",通常涉及到以下几个步骤: 1. **HTML解析**:首先,我们需要解析HTML内容。这通常通过第三方库如Jsoup或Apache POI完成,它们能够解析HTML文档并提取所需的数据结构。 2. **...
在这个场景中,我们探讨如何利用Thymeleaf与Java技术相结合,生成HTML并进一步转换为PDF文件,以便在浏览器中预览或者下载。这个过程通常应用于生成报告、发票或其他需要以结构化文档形式呈现的数据。 首先,让我们...