`
sealbird
  • 浏览: 586266 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

IText中文处理问题!!!

    博客分类:
  • Flex
 
阅读更多
引用
2008年06月05日 星期四 下午 10:29这里说的IText中文处理问题,是指两种生成PDF文档是对中文处理的问题:
第一种是直接通过从数据库查询,或者自己拼接中文字符串生成PDF文档。
第二种是将一个HTML文档转换成PDF文档时的中文处理。
首先说第一种:
    这种很简单,我们只需为加上这样一句:
BaseFont bf = BaseFont.createFont("STSong-Light","UniGB-UCS2-H",BaseFont.NOT_EMBEDDED);
在之后的给Document添加节点是为Paragraph设置字体时设置成BF就可以,如下:
document.add(new Paragraph("混沌之神", new Font(bf)));

源码:
   /**
    * 生成PDF文件解决中文的例子
    *
    * @throws DocumentException
    * @author <b>Innate Solitary</b><br />
    *         创建时间:<b>2008-6-4 下午09:47:37</b><br />
    * @throws IOException
    */
    public static void pdfWriter() throws DocumentException, IOException {
        Document document = new Document();
        PdfWriter.getInstance(document, new FileOutputStream("g:\\Hello.pdf"));
        BaseFont bf = BaseFont.createFont("STSong-Light,Bold", "UniGB-UCS2-H",
                BaseFont.NOT_EMBEDDED);
        document.open();
        document.add(new Paragraph("混沌之神", new Font(bf)));
        document.add(new Paragraph("混沌之神", new Font(bf)));
        document.close();
    }
第二种有个要求是你给的HTML文档必须XHTML文档,格式必须正确,不正确就会报解析HTML文件错误。
我在解决这个问题的时候在网上看到有人给的解决方法是修改IText中的SAXiTextHandler类的源码,在里面加上一句设置BaseFont的一句话,我测试了这样确实可行,同时也想提出这个解决方法的人致敬,他对IText理解很深入。
我们经理找到一个不用修改源码的解决方法,方法如下:
    /**
    * 将HTML文档转换成PDF文档的中文处理的例子
    *
    * @throws Exception
    * @author <b>Innate Solitary</b><br />
    *         创建时间:<b>2008-6-5 下午09:41:22</b><br />
    */
    public static void html2pdf() throws Exception {
        String htmlPath = "g:\\test.html";
        Document doc = new Document();
        BaseFont bf = BaseFont.createFont("STSong-Light,Bold", "UniGB-UCS2-H",
                BaseFont.NOT_EMBEDDED);
        SAXParser parser = SAXParserFactory.newInstance().newSAXParser();
        PdfWriter.getInstance(doc, new FileOutputStream("g:\\test.pdf"));
        SAXmyHtmlHandler saxHandler = new SAXmyHtmlHandler(doc, bf);
        parser.parse(new File(htmlPath), saxHandler);
    }

上面的是源码,我将源码解释一下。
IText之所以会在处理HTML转换PDF是出错,是因为他的内部没有设置中文编码的字体转换,
即没有这三句:
BaseFont bf = BaseFont.createFont("STSong-Light", "UniGB-UCS2-H", BaseFont.NOT_EMBEDDED);
SAXmyHtmlHandler saxHandler = new SAXmyHtmlHandler(doc, bf);
parser.parse(new File(htmlPath), saxHandler);
所以我们只需要将代码改成上面那样,就可以解决中文问题。
这里的SAXParser 是标准的DOM内的SAX解析器,没有测试其他的XML解析器可以处理这里不
分享到:
评论

相关推荐

    IText中文处理问题.txt

    ### IText 中文处理问题详解 #### I. IText简介及中文支持背景 IText 是一个流行的Java库,用于创建、操作PDF文档。...遵循上述指南,开发者可以有效地解决IText中文处理中的常见问题,确保文档的准确性和可读性。

    iText7处理行首行末中文标点符号

    iText7处理行首行末中文标点符号

    Itext中文处理(更新版)

    《Itext中文处理详解(更新版)》 在IT领域,文本处理是一项常见的任务,尤其在处理PDF文档时,Itext库是一个不可或缺的工具。Itext是一个开源的Java库,用于创建、修改和处理PDF文档,它在PDF处理领域具有广泛的影响...

    iText中文帮助文档_itext中文帮助文档_itext_iTextpdf_itext中文文档_

    这个中文帮助文档提供了详细的指导,帮助开发者理解和使用iText来创建包含丰富内容的PDF文件。以下是对iText库和文档中涉及的关键知识点的详细解释: 1. **iText基本概念**: - **PDF(Portable Document Format)...

    itext-2.1.7源码包以及 解决iText生成pdf时中文标点存在行首问题的修改class

    "itext-2.1.7源码包以及 解决iText生成pdf时中文标点存在行首问题的修改class" 这个标题提到了两个关键点。首先,`itext-2.1.7`是开源Java库iText的一个版本,用于创建、修改和操作PDF文档。这个版本的源码包提供了...

    iText5.1.0(解决不支持中文问题)

    总的来说,iText 5.1.0通过引入iTextAsian组件,成功地解决了中文支持问题,为Java开发者提供了更全面的PDF处理解决方案。无论是在企业级应用还是个人项目中,它都是生成和处理中文PDF文档的理想选择。配合详细的...

    itext2.1.7和iTextAsian解决中文问题资源包

    为了克服这个问题,我们引入了iTextAsian.jar,这是一个扩展了iText功能的特殊版本,特别是针对亚洲语言,包括中文。 iText 2.1.7是该库的一个较旧版本,但仍然非常实用,尤其对于那些对性能和兼容性有特定需求的...

    itext 中文帮助手册

    在使用 `iText` 处理中文文档时,首要任务是确保库能够正确显示和处理中文字符。这需要配置适当的字体资源,因为默认的字体可能不包含所有中文字符。`iText` 允许你指定自定义字体,如 SimSun、Arial Unicode MS 或...

    itext7中文输出打包

    这个"itext7中文输出打包"项目,从标题和描述来看,主要是关于如何在iText7中处理中文字符并将其输出到PDF文档中的实践教程。这个IDEA工程提供了一个完整的示例,演示了如何在Java环境中使用iText7来解决中文字符...

    Itext中文api

    在iText中文API中,需要特殊处理中文显示问题,否则生成的PDF文件中将不会显示中文字符。解决这个问题将在第9章中详细介绍。 iText中文API提供了一个强大且灵活的PDF生成工具,使用该工具可以快速创建复杂的PDF文件...

    Java解决Itext pdf中文不显示问题

    然而,当处理中文字符时,Itext可能会出现不显示或者显示乱码的问题。这个问题主要是由于PDF编码格式与Java字符串编码不匹配导致的。下面将详细介绍如何解决Java中Itext PDF中文不显示的问题。 首先,我们需要理解...

    iText中文帮助文档

    这个中文帮助文档可能是开发者社区中热心人士编译翻译的,旨在为不熟悉英文文档的用户提供便利,使其能更好地理解和运用iText进行PDF处理。 iText的核心功能包括: 1. **创建PDF**:iText允许程序员动态生成PDF文档...

    iText5.5中文包

    在标题中提到的"iText5.5中文包"是指iText库的5.5.2版本,它经过优化,能够有效地处理中文字符,为Java开发者提供了一个强大的工具来生成包含中文内容的PDF文档。在描述中提到了"iText-asian",这是一个专门针对亚洲...

    itextpdf 解决中文不显示问题

    itextpdf 再创将pdf格式文件的时候中文不显示或者乱码问题的解决 其实目前最新版本的itexpdf即使加了asian的辅助包也不能解决中文不显示问题 因为自己试过 可能方式不对 这个绝对显示 显示不了的 分不要

    Itext中文使用说明+英文官方API文档

    对于中文使用者来说,Itext中文使用说明是一大福音,因为它帮助开发者更好地理解这个库,特别是对那些英语阅读不太熟练的开发者。这份中文文档通常会解释关键概念,提供示例代码,帮助开发者快速上手,并解决在实际...

    iText以及iText中文所需要的jar包

    因此,"iText中文所需要的包"通常是指iText-Asian扩展包,这个扩展包提供了对东亚语言,包括中文、日文和韩文等的字体和排版支持。iText-Asian包含了对CJK(Chinese, Japanese, Korean)字符集的支持,确保在生成的...

    itext中文操作手册

    ### itext中文操作手册知识点详解 #### 一、iText简介与中文支持 iText是一款强大的Java库,用于创建和操作PDF文档。它不仅能够帮助开发者生成复杂的PDF文件,还能处理PDF的加密、签名以及表单填充等功能。然而,...

    itext中文帮助文档

    iText 是一个流行的 Java 库,用于创建和编辑 PDF 文档。在介绍 iText 的简单应用时...对于中文显示的问题,可以通过调整字体设置来解决。对于更复杂的需求,如表格、图像、链接等,iText 提供了丰富的类和方法来实现。

    IText 和 iTextAsian

    IText和iTextAsian是两个在Java和.NET平台上广泛使用的PDF处理库,它们主要用于创建、编辑和处理PDF文档。IText是主要的核心库,而iTextAsian则是一个扩展,专门针对亚洲字符集的支持,如中文、日文和韩文。 IText...

    iText中文文档.pdf

    iText中文文档.pdf iText是Java语言中一个功能强大的文档处理库,能够生成PDF、RTF、HTML等多种格式的文档。本文档旨在对iText进行详细的介绍,涵盖了iText的简单应用、高级应用、与Struts2的集成等多方面的内容。 ...

Global site tag (gtag.js) - Google Analytics