- 浏览: 586266 次
- 性别:
- 来自: 广州
文章分类
- 全部博客 (365)
- Tomcat调优 (2)
- Apache Http (20)
- Webserver安装 (5)
- Linux安装 (28)
- Linux常用命令 (17)
- C语言及网络编程 (10)
- 文件系统 (0)
- Lucene (12)
- Hadoop (9)
- FastDFS (8)
- 报表 (0)
- 性能测试 (1)
- JAVA (18)
- CSharp (3)
- C++ (38)
- BI (0)
- 数据挖掘 (0)
- 数据采集 (0)
- 网址收集整理 (3)
- Resin (0)
- JBoss (0)
- nginx (0)
- 数据结构 (1)
- 随记 (5)
- Katta (1)
- Shell (6)
- webservice (0)
- JBPM (2)
- JQuery (6)
- Flex (41)
- SSH (0)
- javascript (7)
- php (13)
- 数据库 (6)
- 搜索引擎排序 (2)
- LVS (3)
- solr (2)
- windows (1)
- mysql (3)
- 营销软件 (1)
- tfs (1)
- memcache (5)
- 分布式搜索 (3)
- 关注的博客 (1)
- Android (2)
- clucene (11)
- 综合 (1)
- c c++ 多线程 (6)
- Linux (1)
- 注册码 (1)
- 文件类型转换 (3)
- Linux 与 asp.net (2)
- perl (5)
- coreseek (1)
- 阅读器 (2)
- SEO (1)
- 励志 (1)
- 在线性能测试工具 (1)
- yii (7)
- 服务器监控 (1)
- 广告 (1)
- 代理服务 (5)
- zookeeper (8)
- 广告联盟 (0)
- 常用软件下载 (1)
- 架设自已的站点心得 (0)
最新评论
-
terry07:
java 7 用这个就可以了 Desktop desktop ...
关于java Runtime.getRunTime.exec(String command)的使用 -
HSINKING:
怎么设置打开的dos 窗口是指定的路径下
关于java调用bat文件,不打开窗口 -
liubang201010:
hyperic hq更多参考资料,请访问:http://www ...
hyperic-hq -
^=^:
STDIN_FILENO是unistd.h中定义的一个numb ...
深入理解dup和dup2的用法 -
antor:
留个记号,学习了
[转]用java流方式判断文件类型
引用
2008年06月05日 星期四 下午 10:29这里说的IText中文处理问题,是指两种生成PDF文档是对中文处理的问题:
第一种是直接通过从数据库查询,或者自己拼接中文字符串生成PDF文档。
第二种是将一个HTML文档转换成PDF文档时的中文处理。
首先说第一种:
这种很简单,我们只需为加上这样一句:
BaseFont bf = BaseFont.createFont("STSong-Light","UniGB-UCS2-H",BaseFont.NOT_EMBEDDED);
在之后的给Document添加节点是为Paragraph设置字体时设置成BF就可以,如下:
document.add(new Paragraph("混沌之神", new Font(bf)));
源码:
/**
* 生成PDF文件解决中文的例子
*
* @throws DocumentException
* @author <b>Innate Solitary</b><br />
* 创建时间:<b>2008-6-4 下午09:47:37</b><br />
* @throws IOException
*/
public static void pdfWriter() throws DocumentException, IOException {
Document document = new Document();
PdfWriter.getInstance(document, new FileOutputStream("g:\\Hello.pdf"));
BaseFont bf = BaseFont.createFont("STSong-Light,Bold", "UniGB-UCS2-H",
BaseFont.NOT_EMBEDDED);
document.open();
document.add(new Paragraph("混沌之神", new Font(bf)));
document.add(new Paragraph("混沌之神", new Font(bf)));
document.close();
}
第二种有个要求是你给的HTML文档必须XHTML文档,格式必须正确,不正确就会报解析HTML文件错误。
我在解决这个问题的时候在网上看到有人给的解决方法是修改IText中的SAXiTextHandler类的源码,在里面加上一句设置BaseFont的一句话,我测试了这样确实可行,同时也想提出这个解决方法的人致敬,他对IText理解很深入。
我们经理找到一个不用修改源码的解决方法,方法如下:
/**
* 将HTML文档转换成PDF文档的中文处理的例子
*
* @throws Exception
* @author <b>Innate Solitary</b><br />
* 创建时间:<b>2008-6-5 下午09:41:22</b><br />
*/
public static void html2pdf() throws Exception {
String htmlPath = "g:\\test.html";
Document doc = new Document();
BaseFont bf = BaseFont.createFont("STSong-Light,Bold", "UniGB-UCS2-H",
BaseFont.NOT_EMBEDDED);
SAXParser parser = SAXParserFactory.newInstance().newSAXParser();
PdfWriter.getInstance(doc, new FileOutputStream("g:\\test.pdf"));
SAXmyHtmlHandler saxHandler = new SAXmyHtmlHandler(doc, bf);
parser.parse(new File(htmlPath), saxHandler);
}
上面的是源码,我将源码解释一下。
IText之所以会在处理HTML转换PDF是出错,是因为他的内部没有设置中文编码的字体转换,
即没有这三句:
BaseFont bf = BaseFont.createFont("STSong-Light", "UniGB-UCS2-H", BaseFont.NOT_EMBEDDED);
SAXmyHtmlHandler saxHandler = new SAXmyHtmlHandler(doc, bf);
parser.parse(new File(htmlPath), saxHandler);
所以我们只需要将代码改成上面那样,就可以解决中文问题。
这里的SAXParser 是标准的DOM内的SAX解析器,没有测试其他的XML解析器可以处理这里不
第一种是直接通过从数据库查询,或者自己拼接中文字符串生成PDF文档。
第二种是将一个HTML文档转换成PDF文档时的中文处理。
首先说第一种:
这种很简单,我们只需为加上这样一句:
BaseFont bf = BaseFont.createFont("STSong-Light","UniGB-UCS2-H",BaseFont.NOT_EMBEDDED);
在之后的给Document添加节点是为Paragraph设置字体时设置成BF就可以,如下:
document.add(new Paragraph("混沌之神", new Font(bf)));
源码:
/**
* 生成PDF文件解决中文的例子
*
* @throws DocumentException
* @author <b>Innate Solitary</b><br />
* 创建时间:<b>2008-6-4 下午09:47:37</b><br />
* @throws IOException
*/
public static void pdfWriter() throws DocumentException, IOException {
Document document = new Document();
PdfWriter.getInstance(document, new FileOutputStream("g:\\Hello.pdf"));
BaseFont bf = BaseFont.createFont("STSong-Light,Bold", "UniGB-UCS2-H",
BaseFont.NOT_EMBEDDED);
document.open();
document.add(new Paragraph("混沌之神", new Font(bf)));
document.add(new Paragraph("混沌之神", new Font(bf)));
document.close();
}
第二种有个要求是你给的HTML文档必须XHTML文档,格式必须正确,不正确就会报解析HTML文件错误。
我在解决这个问题的时候在网上看到有人给的解决方法是修改IText中的SAXiTextHandler类的源码,在里面加上一句设置BaseFont的一句话,我测试了这样确实可行,同时也想提出这个解决方法的人致敬,他对IText理解很深入。
我们经理找到一个不用修改源码的解决方法,方法如下:
/**
* 将HTML文档转换成PDF文档的中文处理的例子
*
* @throws Exception
* @author <b>Innate Solitary</b><br />
* 创建时间:<b>2008-6-5 下午09:41:22</b><br />
*/
public static void html2pdf() throws Exception {
String htmlPath = "g:\\test.html";
Document doc = new Document();
BaseFont bf = BaseFont.createFont("STSong-Light,Bold", "UniGB-UCS2-H",
BaseFont.NOT_EMBEDDED);
SAXParser parser = SAXParserFactory.newInstance().newSAXParser();
PdfWriter.getInstance(doc, new FileOutputStream("g:\\test.pdf"));
SAXmyHtmlHandler saxHandler = new SAXmyHtmlHandler(doc, bf);
parser.parse(new File(htmlPath), saxHandler);
}
上面的是源码,我将源码解释一下。
IText之所以会在处理HTML转换PDF是出错,是因为他的内部没有设置中文编码的字体转换,
即没有这三句:
BaseFont bf = BaseFont.createFont("STSong-Light", "UniGB-UCS2-H", BaseFont.NOT_EMBEDDED);
SAXmyHtmlHandler saxHandler = new SAXmyHtmlHandler(doc, bf);
parser.parse(new File(htmlPath), saxHandler);
所以我们只需要将代码改成上面那样,就可以解决中文问题。
这里的SAXParser 是标准的DOM内的SAX解析器,没有测试其他的XML解析器可以处理这里不
发表评论
-
swf文件压缩
2011-12-01 18:29 1347from http://www.9ria.com/news/2 ... -
swf文件的数据结构以及转为exe或从exe中剥离出swf的代码
2011-11-14 22:11 2121swf文件的数据结构以及转为exe或从exe中剥离出swf的源 ... -
swf的详细介绍
2011-11-14 21:17 1235介绍链接一 http://as3.iteye.com/blog ... -
三个重要的处理swf的开源软件
2011-11-14 18:33 1318抓紧时间研究jswiff,swfmill,swfml jsw ... -
FlexBook
2011-05-06 13:12 1558FlexBook from [url ... -
[2011-04] Flex里自定义进度条ProgressBar样式皮肤
2011-04-20 15:47 26332011-01-29 11:08trackbar是整个的条 ... -
[2011-04] flex弹出模式窗口
2011-04-19 17:25 16201、创建一个component,继承自 TitleWindow ... -
[2011-04] Flex调用C# Webservice
2011-04-19 14:19 1149关键字: flex数据交互 终于试出flex用WebSer ... -
[2011-04-19]Flex程序实现背景贴图的两种方式
2011-04-19 10:33 1271Flex程序实现背景贴图的两种方式 Two ways to i ... -
Flex Component Kit for Flash CS3 安装方法及前提
2011-04-15 10:22 1289from http://kingapex.iteye.com/ ... -
as3 flash web 应用 (6)swfobject的使用:将flash嵌入页面
2011-04-14 10:27 2453from http://hi.baidu.com/yukon_ ... -
pdftk 为偶数页加水印
2011-03-23 17:27 2251引用查看完整版本 : 找 ... -
借助 unoconv 批量转 xls 到 pdf文件
2011-03-23 14:44 3320文章分类:Web前端 因为 ... -
swftools安装
2011-03-09 08:44 1465安装swftools工具时,在windows平台下是很简单的事 ... -
flex3下使用全屏模式
2011-03-03 10:12 987引用flex3下使用全屏模式 MXML: -------- ... -
Flex生成SDK下Local目录下的语言包
2011-02-25 16:44 1657from http://sensaran.wordpress. ... -
swf文件格式解析入门(tag解析)
2011-02-24 15:24 2848收藏 swf文件格式解析入门(tag解析) 2010 ... -
转成swf文件注意事项
2011-02-21 10:23 8911\ 这里同时给大家提供一个建议就是,对于纯位图的资源文 ... -
AS获取SWF文件的宽和高!(实现如下类)
2011-02-17 17:57 1440主页博客相册|个人档案 ... -
解析SWF文件头中的Rect结构
2011-02-15 15:25 1675编辑 文章分类:Flash编程 ...
相关推荐
### IText 中文处理问题详解 #### I. IText简介及中文支持背景 IText 是一个流行的Java库,用于创建、操作PDF文档。...遵循上述指南,开发者可以有效地解决IText中文处理中的常见问题,确保文档的准确性和可读性。
iText7处理行首行末中文标点符号
《Itext中文处理详解(更新版)》 在IT领域,文本处理是一项常见的任务,尤其在处理PDF文档时,Itext库是一个不可或缺的工具。Itext是一个开源的Java库,用于创建、修改和处理PDF文档,它在PDF处理领域具有广泛的影响...
这个中文帮助文档提供了详细的指导,帮助开发者理解和使用iText来创建包含丰富内容的PDF文件。以下是对iText库和文档中涉及的关键知识点的详细解释: 1. **iText基本概念**: - **PDF(Portable Document Format)...
"itext-2.1.7源码包以及 解决iText生成pdf时中文标点存在行首问题的修改class" 这个标题提到了两个关键点。首先,`itext-2.1.7`是开源Java库iText的一个版本,用于创建、修改和操作PDF文档。这个版本的源码包提供了...
总的来说,iText 5.1.0通过引入iTextAsian组件,成功地解决了中文支持问题,为Java开发者提供了更全面的PDF处理解决方案。无论是在企业级应用还是个人项目中,它都是生成和处理中文PDF文档的理想选择。配合详细的...
为了克服这个问题,我们引入了iTextAsian.jar,这是一个扩展了iText功能的特殊版本,特别是针对亚洲语言,包括中文。 iText 2.1.7是该库的一个较旧版本,但仍然非常实用,尤其对于那些对性能和兼容性有特定需求的...
在使用 `iText` 处理中文文档时,首要任务是确保库能够正确显示和处理中文字符。这需要配置适当的字体资源,因为默认的字体可能不包含所有中文字符。`iText` 允许你指定自定义字体,如 SimSun、Arial Unicode MS 或...
这个"itext7中文输出打包"项目,从标题和描述来看,主要是关于如何在iText7中处理中文字符并将其输出到PDF文档中的实践教程。这个IDEA工程提供了一个完整的示例,演示了如何在Java环境中使用iText7来解决中文字符...
在iText中文API中,需要特殊处理中文显示问题,否则生成的PDF文件中将不会显示中文字符。解决这个问题将在第9章中详细介绍。 iText中文API提供了一个强大且灵活的PDF生成工具,使用该工具可以快速创建复杂的PDF文件...
然而,当处理中文字符时,Itext可能会出现不显示或者显示乱码的问题。这个问题主要是由于PDF编码格式与Java字符串编码不匹配导致的。下面将详细介绍如何解决Java中Itext PDF中文不显示的问题。 首先,我们需要理解...
这个中文帮助文档可能是开发者社区中热心人士编译翻译的,旨在为不熟悉英文文档的用户提供便利,使其能更好地理解和运用iText进行PDF处理。 iText的核心功能包括: 1. **创建PDF**:iText允许程序员动态生成PDF文档...
在标题中提到的"iText5.5中文包"是指iText库的5.5.2版本,它经过优化,能够有效地处理中文字符,为Java开发者提供了一个强大的工具来生成包含中文内容的PDF文档。在描述中提到了"iText-asian",这是一个专门针对亚洲...
itextpdf 再创将pdf格式文件的时候中文不显示或者乱码问题的解决 其实目前最新版本的itexpdf即使加了asian的辅助包也不能解决中文不显示问题 因为自己试过 可能方式不对 这个绝对显示 显示不了的 分不要
对于中文使用者来说,Itext中文使用说明是一大福音,因为它帮助开发者更好地理解这个库,特别是对那些英语阅读不太熟练的开发者。这份中文文档通常会解释关键概念,提供示例代码,帮助开发者快速上手,并解决在实际...
因此,"iText中文所需要的包"通常是指iText-Asian扩展包,这个扩展包提供了对东亚语言,包括中文、日文和韩文等的字体和排版支持。iText-Asian包含了对CJK(Chinese, Japanese, Korean)字符集的支持,确保在生成的...
### itext中文操作手册知识点详解 #### 一、iText简介与中文支持 iText是一款强大的Java库,用于创建和操作PDF文档。它不仅能够帮助开发者生成复杂的PDF文件,还能处理PDF的加密、签名以及表单填充等功能。然而,...
iText 是一个流行的 Java 库,用于创建和编辑 PDF 文档。在介绍 iText 的简单应用时...对于中文显示的问题,可以通过调整字体设置来解决。对于更复杂的需求,如表格、图像、链接等,iText 提供了丰富的类和方法来实现。
IText和iTextAsian是两个在Java和.NET平台上广泛使用的PDF处理库,它们主要用于创建、编辑和处理PDF文档。IText是主要的核心库,而iTextAsian则是一个扩展,专门针对亚洲字符集的支持,如中文、日文和韩文。 IText...
iText中文文档.pdf iText是Java语言中一个功能强大的文档处理库,能够生成PDF、RTF、HTML等多种格式的文档。本文档旨在对iText进行详细的介绍,涵盖了iText的简单应用、高级应用、与Struts2的集成等多方面的内容。 ...