`
shappy1978
  • 浏览: 703181 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

xpdf备忘

    博客分类:
  • J2EE
阅读更多

    由于pdfbox一直没有解决中文字体,不得不寻求其他路径,xpdf竟然只是一个软件,只是通过java采用命令行调用,并获取输出结果,如此来说使用简单,但是相当受限,如:无法跨平台,无法处理特定格式(表格等),无法处理图片和其他附件。这种调用必定限制了它的灵活性。

    下载:ftp://ftp.foolabs.com/pub/xpdf/xpdf-3.00pl3-win32.zip,简体补丁:ftp://ftp.foolabs.com/pub/xpdf/xpdf-chinese-simplified.tar.gz

    详细的安装和使用教程,http://www.cnblogs.com/zhengyun_ustc/archive/2005/08/03/206685.html

    测试结果:

1 Identity-H编码可以解析

2 同样会出现文字中间有空格的情况

3 会打印页尾,原本应该换行的地方用空格替换,导致没有换行,只有一页才换一次行

4 找了几个繁体版的dpf试了一下,似乎可以,但是下面这个附件不行,只能解出少数的几个字,可能和表格或者排版有关。

5 相当严重的问题,会出现文字错位,例子:21 年 0 月 0 日印发 00 2 9,原文是:2010年02月09日引发。彻底晕菜(pdfbox没有这个问题)。

  • tr1.pdf (158.1 KB)
  • 下载次数: 9
1
0
分享到:
评论

相关推荐

    基于xPDF和Qt的PDF阅读器。

    PDFReader-D是一个基于xPDF库和Qt框架开发的PDF阅读器项目。这个项目的主要目标是提供一个用户友好的界面来查看PDF文档,并且能够处理PDF中的层(Layers)信息。xPDF是一个开源的PDF处理工具集,它包含了处理PDF文件...

    Xpdf Language Support Packages

    Xpdf是一款广受欢迎的开源PDF阅读器,专为那些寻求轻量级且功能强大的PDF文档查看解决方案的用户设计。这款软件支持多种操作系统,包括但不限于Linux、Windows和macOS,这使得它在跨平台应用中具有很高的灵活性。...

    xpdf实现pdf读取

    Xpdf是一款开源的PDF阅读器和工具集,主要用于Linux系统,它提供了查看、打印和提取PDF文件内容的功能。本篇文章将详细介绍如何使用Xpdf来实现PDF的读取。 首先,Xpdf的核心组件包括: 1. **pdftotext**:这个工具...

    xpdf-3.02pl4-win32.zip

    《Xpdf:Windows平台下的PDF阅读与处理工具》 Xpdf是一个开源的PDF文档阅读、转换和处理工具,尤其在处理非英文文档方面表现出色。标题中的"xpdf-3.02pl4-win32.zip"是Xpdf的3.02pl4版本,专为Windows 32位操作系统...

    开源pdf库(XPDF) VC6.0测试工程

    **开源PDF库XPDF在VC6.0下的测试工程** XPDF是一款著名的开源PDF库,主要功能是解析、渲染和处理PDF文档。它由多个组件组成,包括pdftohtml、pdffonts、pdfinfo等,可用于查看PDF元数据、提取文本和图像,以及将PDF...

    xpdf-chinese-simplified.zip

    《Xpdf中文版详解及其在文档处理中的应用》 Xpdf是一款开源的PDF文档阅读和处理工具,专门针对中文环境进行了优化,名为"xpdf-chinese-simplified",其压缩包文件"xpdf-chinese-simplified.zip"包含了适用于简体...

    pdf编辑文件xpdf

    安装xpdf的过程通常涉及到下载源代码包,例如你提供的xpdf-3.03,然后通过编译和安装步骤来完成。首先,解压下载的压缩包: ``` tar -zxvf xpdf-3.03.tar.gz ``` 接着,进入解压后的目录并配置安装: ``` cd xpdf-...

    xpdf4.0库,使用C/C++操作PDF文件的库

    Xpdf库是一个强大的开源工具包,专为C和C++开发者设计,用于处理PDF(Portable Document Format)文件。这个库提供了丰富的API,使得在各种应用中读取、解析、渲染和编辑PDF文档变得轻而易举。Xpdf库的最新版本是...

    xPDF For PHP (PHP读取PDF文件) php_xpdf.dll

    PHP读取PDF文件, 仅支持 Thread Safety 版本的 PHP 5.5.x / 5.6.x / 7.0.x / 7.1.x / 7.2.x, 将对应的版本 php_xpdf.dll 复制到 PHP ext 目录下。 编译采用版本分别为 5.5.38 / 5.6.40 / 7.0.33 / 7.1.26 / 7.2.14 ...

    xpdf配置修改完成版

    **Xpdf:PDF处理工具的配置与应用** Xpdf是一款开源的PDF阅读器和转换工具,主要用于在Linux和Unix环境中查看、转换以及提取PDF文档内容。这个“xpdf配置修改完成版”似乎已经预设了适合直接使用的配置,使得用户...

    java代码xpdf实例

    Java代码中的XPDF实例主要涉及的是使用XPDF库在Java应用程序中处理PDF文档。XPDF是一套开源的PDF工具,包括了PDF文档的查看、转换、提取文本等能力。在这个实例中,我们可能会关注以下几个核心知识点: 1. **XPDF ...

    xpdf-4.03.tar.gz

    《xpdf:一款高效实用的PDF阅读器》 在信息化高度发展的今天,PDF(Portable Document Format)文件格式已经成为文档分享和传播的主流选择。而xpdf,作为一个历史悠久且备受推崇的开源PDF阅读器,为用户提供了高效...

    用xpdf和pdfbox来处理中文PDF文档及其比较

    本文将探讨如何使用xpdf和PDFBox这两个开源库来处理中文PDF文档,并对它们进行比较。 首先,xpdf是一个开源的PDF阅读和处理工具集,主要包含pdftotext、pdffonts、pdfinfo和pdftoppm等组件。在处理中文PDF时,xpdf...

    使用xpdf提取中文PDF文档

    ### 使用xpdf提取中文PDF文档知识点详解 #### 一、前言 随着数字化时代的到来,PDF文档因其良好的兼容性和稳定性而被广泛应用于各种场景中。然而,在处理包含大量中文内容的PDF时,如何高效准确地提取其中的文字...

    配置完整的xpdf支持中文日文希腊文

    xpdf是一款开源的PDF阅读和处理工具集,主要包含pdftotext、pdfinfo、pdffonts和pdfimages等组件,用于在命令行环境下操作PDF文档。本配置指南将详细介绍如何使xpdf支持中文、日文以及希腊文,以便在处理多语言PDF...

    xpdf-chinese-simplified.rar

    标题中的"xpdf-chinese-simplified.rar"表明这是一个与处理中文PDF文档相关的压缩包,其中包含了XPDF工具的简体中文版本。XPDF是一款开源的PDF文档处理工具集,主要用于PDF文档的查看、转换和提取信息,尤其在处理非...

    Xpdf of linux

    **Xpdf 在 Linux 环境中的应用与详解** Xpdf 是一款专为 Linux 操作系统设计的轻量级 PDF 阅读器。它以其小巧的体积、快速的加载速度以及基本的功能集,成为许多 Linux 用户首选的 PDF 查看工具。在某些情况下,...

    xpdf的资源.rar

    **Xpdf:强大的PDF阅读与处理工具** Xpdf是一款开源的PDF文档查看和处理工具,主要在命令行环境下运行,提供了丰富的功能,包括PDF文档的查看、文本提取、页面转换等。这款工具因其轻量级、高效且跨平台的特性,在...

Global site tag (gtag.js) - Google Analytics