由于pdfbox一直没有解决中文字体,不得不寻求其他路径,xpdf竟然只是一个软件,只是通过java采用命令行调用,并获取输出结果,如此来说使用简单,但是相当受限,如:无法跨平台,无法处理特定格式(表格等),无法处理图片和其他附件。这种调用必定限制了它的灵活性。
下载:ftp://ftp.foolabs.com/pub/xpdf/xpdf-3.00pl3-win32.zip,简体补丁:ftp://ftp.foolabs.com/pub/xpdf/xpdf-chinese-simplified.tar.gz
详细的安装和使用教程,http://www.cnblogs.com/zhengyun_ustc/archive/2005/08/03/206685.html
测试结果:
1 Identity-H编码可以解析
2 同样会出现文字中间有空格的情况
3 会打印页尾,原本应该换行的地方用空格替换,导致没有换行,只有一页才换一次行
4 找了几个繁体版的dpf试了一下,似乎可以,但是下面这个附件不行,只能解出少数的几个字,可能和表格或者排版有关。
5 相当严重的问题,会出现文字错位,例子:21 年 0 月 0 日印发 00 2 9,原文是:2010年02月09日引发。彻底晕菜(pdfbox没有这个问题)。
分享到:
相关推荐
PDFReader-D是一个基于xPDF库和Qt框架开发的PDF阅读器项目。这个项目的主要目标是提供一个用户友好的界面来查看PDF文档,并且能够处理PDF中的层(Layers)信息。xPDF是一个开源的PDF处理工具集,它包含了处理PDF文件...
Xpdf是一款广受欢迎的开源PDF阅读器,专为那些寻求轻量级且功能强大的PDF文档查看解决方案的用户设计。这款软件支持多种操作系统,包括但不限于Linux、Windows和macOS,这使得它在跨平台应用中具有很高的灵活性。...
Xpdf是一款开源的PDF阅读器和工具集,主要用于Linux系统,它提供了查看、打印和提取PDF文件内容的功能。本篇文章将详细介绍如何使用Xpdf来实现PDF的读取。 首先,Xpdf的核心组件包括: 1. **pdftotext**:这个工具...
《Xpdf:Windows平台下的PDF阅读与处理工具》 Xpdf是一个开源的PDF文档阅读、转换和处理工具,尤其在处理非英文文档方面表现出色。标题中的"xpdf-3.02pl4-win32.zip"是Xpdf的3.02pl4版本,专为Windows 32位操作系统...
《Xpdf中文版详解及其在文档处理中的应用》 Xpdf是一款开源的PDF文档阅读和处理工具,专门针对中文环境进行了优化,名为"xpdf-chinese-simplified",其压缩包文件"xpdf-chinese-simplified.zip"包含了适用于简体...
安装xpdf的过程通常涉及到下载源代码包,例如你提供的xpdf-3.03,然后通过编译和安装步骤来完成。首先,解压下载的压缩包: ``` tar -zxvf xpdf-3.03.tar.gz ``` 接着,进入解压后的目录并配置安装: ``` cd xpdf-...
Xpdf库是一个强大的开源工具包,专为C和C++开发者设计,用于处理PDF(Portable Document Format)文件。这个库提供了丰富的API,使得在各种应用中读取、解析、渲染和编辑PDF文档变得轻而易举。Xpdf库的最新版本是...
PHP读取PDF文件, 仅支持 Thread Safety 版本的 PHP 5.5.x / 5.6.x / 7.0.x / 7.1.x / 7.2.x, 将对应的版本 php_xpdf.dll 复制到 PHP ext 目录下。 编译采用版本分别为 5.5.38 / 5.6.40 / 7.0.33 / 7.1.26 / 7.2.14 ...
**开源PDF库XPDF在VC6.0下的测试工程** XPDF是一款著名的开源PDF库,主要功能是解析、渲染和处理PDF文档。它由多个组件组成,包括pdftohtml、pdffonts、pdfinfo等,可用于查看PDF元数据、提取文本和图像,以及将PDF...
**Xpdf:PDF处理工具的配置与应用** Xpdf是一款开源的PDF阅读器和转换工具,主要用于在Linux和Unix环境中查看、转换以及提取PDF文档内容。这个“xpdf配置修改完成版”似乎已经预设了适合直接使用的配置,使得用户...
Java代码中的XPDF实例主要涉及的是使用XPDF库在Java应用程序中处理PDF文档。XPDF是一套开源的PDF工具,包括了PDF文档的查看、转换、提取文本等能力。在这个实例中,我们可能会关注以下几个核心知识点: 1. **XPDF ...
《xpdf:一款高效实用的PDF阅读器》 在信息化高度发展的今天,PDF(Portable Document Format)文件格式已经成为文档分享和传播的主流选择。而xpdf,作为一个历史悠久且备受推崇的开源PDF阅读器,为用户提供了高效...
### 使用xpdf提取中文PDF文档知识点详解 #### 一、前言 随着数字化时代的到来,PDF文档因其良好的兼容性和稳定性而被广泛应用于各种场景中。然而,在处理包含大量中文内容的PDF时,如何高效准确地提取其中的文字...
标题中的"xpdf-chinese-simplified.rar"表明这是一个与处理中文PDF文档相关的压缩包,其中包含了XPDF工具的简体中文版本。XPDF是一款开源的PDF文档处理工具集,主要用于PDF文档的查看、转换和提取信息,尤其在处理非...
**Xpdf 在 Linux 环境中的应用与详解** Xpdf 是一款专为 Linux 操作系统设计的轻量级 PDF 阅读器。它以其小巧的体积、快速的加载速度以及基本的功能集,成为许多 Linux 用户首选的 PDF 查看工具。在某些情况下,...
**Xpdf:强大的PDF阅读与处理工具** Xpdf是一款开源的PDF文档查看和处理工具,主要在命令行环境下运行,提供了丰富的功能,包括PDF文档的查看、文本提取、页面转换等。这款工具因其轻量级、高效且跨平台的特性,在...
《Xpdf中文支持与字体详解》 在信息技术领域,PDF(Portable Document Format)是一种广泛使用的文档格式,它能够保持文档的原始布局和样式,便于跨平台分享和阅读。然而,对于中文用户而言,PDF文档的显示效果往往...
XPDF是一套开源的PDF阅读和处理工具,它提供了PDF文件的查看、转换和提取等功能,是理解和处理PDF格式的重要工具集。 在“CHANGES”文件中,通常会记录XPDF各版本之间的更新和改进,包括错误修复、新功能添加以及...