`
wuzijingaip
  • 浏览: 329608 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

Java HTML直接导出PDF

 
阅读更多

Java  HTML直接导出PDF

对于java中如何从html中直接导出pdf,有很多的开源代码,这里个人用itext转。

首先需要的包有:core-renderer-1.0.jar

core-renderer-R8pre1.jar

core-renderer.jar

iText-2.0.8.jar

jtidy-4aug2000r7-dev.jar

Tidy.jar

iTextAsian.jar

java代码的话就比较简单了。具体是先用Tidy将html转换为xhtml,将xhtml转换为其它各种格式的。虽然在转化到pdf时也是用的iText。代码如下:

Java代码  收藏代码
  1. //struts1.x中  
Java代码  收藏代码
  1. else if("Html2Pdf".equalsIgnoreCase(action)){  
  2.     exportPdfFile("http://localhost:8080/jsp/test.jsp");  
  3.     return null;  
  4. }  
  5.   
  6. // 导出pdf add by huangt 2012.6.1  
  7.     public File exportPdfFile(String urlStr) throws BaseException {  
  8.         // String outputFile = this.fileRoot + "/" +  
  9.         // ServiceConstants.DIR_PUBINFO_EXPORT + "/" + getFileName() + ".pdf";  
  10.         String outputFile = "d:/test3.pdf";  
  11.         OutputStream os;  
  12.         try {  
  13.             os = new FileOutputStream(outputFile);  
  14.   
  15.             ITextRenderer renderer = new ITextRenderer();  
  16.   
  17.             String str = getHtmlFile(urlStr);  
  18.             renderer.setDocumentFromString(str);  
  19.             ITextFontResolver fontResolver = renderer.getFontResolver();  
  20.               
  21.             fontResolver.addFont("C:/WINDOWS/Fonts/SimSun.ttc",BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED);// 宋体字  
  22.             fontResolver.addFont("C:/WINDOWS/Fonts/Arial.ttf",BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED);// 宋体字  
  23.             renderer.layout();  
  24.   
  25.             renderer.createPDF(os);  
  26.   
  27.             System.out.println("转换成功!");  
  28.             os.flush();  
  29.             os.close();  
  30.             return new File(outputFile);  
  31.         } catch (FileNotFoundException e) {  
  32.             // logger.error("不存在文件!" + e.getMessage());  
  33.             throw new BaseException(e);  
  34.         } catch (DocumentException e) {  
  35.             // logger.error("生成pdf时出错了!" + e.getMessage());  
  36.             throw new BaseException(e);  
  37.         } catch (IOException e) {  
  38.             // logger.error("pdf出错了!" + e.getMessage());  
  39.             throw new BaseException(e);  
  40.         }  
  41.   
  42.     }  
  43.   
  44.     // 读取页面内容 add by huangt 2012.6.1  
  45.     public String getHtmlFile(String urlStr) throws BaseException {  
  46.         URL url;  
  47.         try {  
  48.             if (urlStr.indexOf("?") != -1) {  
  49.                 urlStr = urlStr + "&locale="  
  50.                         + LocaleContextHolder.getLocale().toString();  
  51.             } else {  
  52.                 urlStr = urlStr + "?locale="  
  53.                         + LocaleContextHolder.getLocale().toString();  
  54.             }  
  55.             url = new URL(urlStr);  
  56.   
  57.             URLConnection uc = url.openConnection();  
  58.             InputStream is = uc.getInputStream();  
  59.               
  60.             Tidy tidy = new Tidy();  
  61.   
  62.             OutputStream os2 = new ByteArrayOutputStream();  
  63.             tidy.setXHTML(true); // 设定输出为xhtml(还可以输出为xml)  
  64.             tidy.setCharEncoding(Configuration.UTF8); // 设定编码以正常转换中文  
  65.             tidy.setTidyMark(false); // 不设置它会在输出的文件中给加条meta信息  
  66.             tidy.setXmlPi(true); // 让它加上<?xml version="1.0"?>  
  67.             tidy.setIndentContent(true); // 缩进,可以省略,只是让格式看起来漂亮一些  
  68.             tidy.parse(is, os2);  
  69.   
  70.             is.close();  
  71.   
  72.             // 解决乱码 --将转换后的输出流重新读取改变编码  
  73.             String temp;  
  74.             StringBuffer sb = new StringBuffer();  
  75.             BufferedReader in = new BufferedReader(new InputStreamReader(  
  76.                     new ByteArrayInputStream(  
  77.                             ((ByteArrayOutputStream) os2).toByteArray()),  
  78.                     "utf-8"));  
  79.             while ((temp = in.readLine()) != null) {  
  80.                 sb.append(temp);  
  81.             }  
  82.   
  83.             return sb.toString();  
  84.         } catch (IOException e) {  
  85.             // logger.error("读取客户端网页文本信息时出错了" + e.getMessage());  
  86.             throw new BaseException(e);  
  87.         }  
  88.   
  89.     }  

 

为了解决包的问题,加上Maven <!-- pdf导出 -->

Xml代码  收藏代码
  1. <dependency>  
  2.     <groupId>com.lowagie</groupId>  
  3.     <artifactId>itext</artifactId>  
  4.     <version>2.1.7</version>  
  5. </dependency>  
  6. <dependency>  
  7.     <groupId>org.xhtmlrenderer.flyingsaucer</groupId>  
  8.     <artifactId>pdf-renderer</artifactId>  
  9.     <version>1.0</version>  
  10. </dependency>  
  11. <dependency>  
  12.     <groupId>jtidy</groupId>  
  13.     <artifactId>jtidy</artifactId>  
  14.     <version>4aug2000r7-dev</version>  
  15.     <type>jar</type>  
  16.     <scope>compile</scope>  
  17. </dependency>  
  18. <dependency>  
  19.     <groupId>net.sf.barcode4j</groupId>  
  20.     <artifactId>barcode4j-light</artifactId>  
  21.     <version>2.0</version>  
  22. </dependency>  
  23. <dependency>  
  24.     <groupId>avalon-framework</groupId>  
  25.     <artifactId>avalon-framework-impl</artifactId>  
  26.     <version>4.2.0</version>  
  27. </dependency>  
  28. <!-- pdf -->  

 

另外附上 稍微复杂的PDFUtils.java文件,由于没时间就不做整理解释了!见下载附件!

分享到:
评论

相关推荐

    Java HTML直接导出PDF

    在IT行业中,将HTML内容直接导出为PDF是一种常见的需求,尤其在报表生成、文档打印或者网络内容保存等方面。这个话题涉及到Java编程语言以及相关的库和技术。本文将深入讲解如何利用Java来实现这一功能,主要关注`...

    Java HTML直接导出PDF需要的包

    Java HTML直接导出PDF需要的包有:core-renderer-1.0.jar core-renderer-R8pre1.jar core-renderer.jar iText-2.0.8.jar jtidy-4aug2000r7-dev.jar Tidy.jar iTextAsian.jar

    java根据模板导出PDF详细教程(包含统计图)

    本文将深入探讨如何使用Java来根据模板导出包含统计图的PDF文档。主要涉及的技术包括iText库、FreeMarker模板引擎以及可能的数据可视化工具。 首先,iText是一个强大的Java库,专门用于创建和操作PDF文档。它提供了...

    java导出docx导出pdf

    Java编程语言在处理文档转换方面提供了强大的支持,...综上所述,"java导出docx导出pdf"的项目提供了一个Java解决方案,通过利用Apache POI和iText库,实现了从Docx到PDF的快速转换,适用于各种需要文档转换的场景。

    java将页面导出PDF.zip

    在这个案例中,"将页面导出PDF.zip"文件可能包含了使用其中一个库的示例代码,特别是Flying Saucer,因为它擅长将HTML内容转换为PDF。 Flying Saucer是一个强大的Java库,它能够解析HTML并将其渲染为PDF、XPS或其他...

    java使用itext导出PDF文本绝对定位(实现方法)

    java使用iText导出PDF文本绝对定位(实现方法) iText是一个流行的Java类库,用于生成PDF文档。下面我们将探讨如何使用iText在Java中导出PDF文本,并实现绝对定位。 iText简介 iText是一个开源的Java类库,用于...

    java实现导出pdf文件

    在Java开发中,导出PDF文件是一项常见的需求,特别是在生成报表、文档或发票等场景下。iText是一个强大的Java库,专门用于创建和修改PDF文档。在这个过程中,我们将深入探讨如何使用iText库来实现从网页(JSP)导出...

    java根据模板导出PDF详细教程(包含统计图).rar

    在本文档中,我们将探讨如何使用Java来根据模板导出包含统计图的PDF文档。主要涉及的技术包括iText库、FreeMarker模板引擎以及可能的数据处理和图形生成。 首先,iText是一个强大的Java库,用于创建和修改PDF文档。...

    Java导出pdf 利用模板导出

    在Java开发中,导出PDF是一项常见的需求,例如生成报告、报表或者合同等。这个话题主要涉及Java处理PDF文档的技术,以及如何利用模板来高效地生成PDF内容。在这个场景下,我们可以使用开源库如iText或Apache PDFBox...

    JAVA导出PDF文件所需相关配置文件

    在Java开发中,导出PDF文件是一项常见的任务,尤其在报表生成、文档创建等领域。PDF(Portable Document Format)因其跨平台、格式保持等特性而被广泛使用。本篇将详细介绍在Java环境下,导出PDF所需的配置文件以及...

    java导出pdf.zip

    Java导出PDF是一种常见的技术需求,特别是在开发报告生成、数据可视化或者文档呈现的场景中。在Java中,我们可以使用各种库来实现将数据导出为PDF格式的功能。本篇文章将详细探讨这一主题。 首先,我们需要了解PDF...

    java导出pdf文件

    在Java编程环境中,导出PDF(Portable Document Format)文件是一项常见的任务,这通常涉及到将数据、文本或图形从应用程序转换成这种广泛支持的格式,以便于分发和打印。PDF文件格式具有跨平台兼容性,可以保留原始...

    java实现HTML页面转PDF亲测好用

    你也可以考虑使用专门为Java设计的HTML转PDF库,如PDFreactor、Flying Saucer或HtmlUnit,它们通常提供更丰富的API和更好的集成。 在实际项目中,你可能需要处理更复杂的情况,比如设置PDF页面大小、自定义CSS样式...

    java+ireport 例子 导出html以及pdf

    java+ireport 例子 导出html以及pdf 可以直接运行,使用的是mysql数据库 DROP TABLE IF EXISTS `t_user`; CREATE TABLE `t_user` ( `id` int(11) NOT NULL AUTO_INCREMENT, `name` varchar(10) DEFAULT NULL, `...

    freemark模板导出PDF

    本篇文章将详细讲解如何利用FreeMarker模板来导出PDF文件。 1. **FreeMarker基本概念** FreeMarker是Java语言的一个模板引擎,它与Spring、Struts等框架结合紧密,允许开发者将逻辑代码与展示层分离,通过模板文件...

    JAVA使用itextpdf实现HTML转PDF

    总之,使用iTextPDF库在Java中实现HTML到PDF的转换是一项实用的技能,但需要注意库对HTML和CSS的支持限制。根据实际需求,可能需要对HTML源码进行调整,或者考虑使用其他兼容性更强的库来实现更丰富的转换效果。

    easypoi的使用demo,包含Excel模板导出,html导出Excel,Excel导出pdf等

    在标题和描述中提到的几个关键功能,我们将详细探讨如何使用Easy POI进行Excel模板导出、HTML导出为Excel以及Excel导出为PDF。 1. Excel模板导出: Easy POI允许开发者使用预定义的Excel模板来导出数据。在模板中...

    PD4ML 实测Java将HTML导出为PDF 成功解决中文乱码问题

    PD4ML是一个Java库,专门用于将HTML内容转换为高质量的PDF文档。本篇将深入探讨如何使用PD4ML实现在Java环境中处理中文乱码问题,并提供相关文件的背景和用途。 首先,我们要理解为何会出现中文乱码。在处理非ASCII...

    itext html导出pdf

    在描述中提到的"itext html导出pdf",通常涉及到以下几个步骤: 1. **HTML解析**:首先,我们需要解析HTML内容。这通常通过第三方库如Jsoup或Apache POI完成,它们能够解析HTML文档并提取所需的数据结构。 2. **...

    thymeleaf框架通过java渲染html生成pdf

    在这个场景中,我们探讨如何利用Thymeleaf与Java技术相结合,生成HTML并进一步转换为PDF文件,以便在浏览器中预览或者下载。这个过程通常应用于生成报告、发票或其他需要以结构化文档形式呈现的数据。 首先,让我们...

Global site tag (gtag.js) - Google Analytics