要读取pdf文件,必须有pdfbox1.7.1.jar和fontbox1.7.1.jar,可以到官网下,也可以到我的资源里下,下面代码
import java.io.FileWriter;
import java.io.IOException;
import java.io.PrintWriter;
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.util.PDFTextStripper;
public class Mytest {
public static String getText(String file) {
String s = "";
String pdffile = file;
PDDocument pdfdoc = null;
try {
pdfdoc = PDDocument.load(pdffile);
PDFTextStripper stripper = new PDFTextStripper();
s = stripper.getText(pdfdoc);
} catch (IOException e) {
e.printStackTrace();
} finally {
try {
if (pdfdoc != null) {
pdfdoc.close();
}
} catch (IOException e) {
e.printStackTrace();
}
}
return s;
}
public static void toTextFile(String doc, String filename) throws Exception {
String pdffile = doc;
PDDocument pdfdoc = null;
PrintWriter pw = null;
try {
pdfdoc = PDDocument.load(pdffile);
PDFTextStripper stripper = new PDFTextStripper();
pw = new PrintWriter(new FileWriter(filename));
stripper.writeText(pdfdoc, pw);
} catch (IOException e) {
e.printStackTrace();
} finally {
try {
if(pw!=null){
pw.close();
}
if (pdfdoc != null) {
pdfdoc.close();
}
} catch (IOException e) {
e.printStackTrace();
}
}
}
public static void main(String[] args) {
try {
String sc = getText("在这里输入要转换的pdf文件路径");
System.out.print(sc);
toTextFile("在这里输入要转换的pdf文件路径",
"要保存的txt文件路径");
} catch (Exception e) {
e.printStackTrace();
}
}
}
分享到:
相关推荐
描述中的"一个java操作pdf文件的开发包,很好用的"进一步确认了这个压缩包包含了一个实用的Java PDF处理库,可能是iText的示例代码或者封装好的API,方便开发者快速上手。 标签"java.pdf_ java_pdf java操作pdf"则...
然后,可以通过以下步骤操作PDF: 1. **创建PDF**:通过`Document`对象创建一个新的PDF文档,设置文档的边距和页面大小。 2. **添加内容**:使用`Paragraph`、`Font`、`Chunk`等类,添加文本、设置字体和字号。对于...
在Java编程环境中,读取PDF文件是一项常见的任务,特别是在开发桌面应用或需要处理PDF文档内容时。本篇文章将深入探讨如何使用Java来读取PDF文件,并将其内容展示在一个由JFrame和JPanel构建的GUI窗口中。 首先,...
在IT领域,特别是Java编程中,读取PDF文件的元数据是一项常见的需求,尤其是在文档管理、内容管理系统或任何需要处理大量文档的应用场景中。本文将深入探讨如何使用Java读取PDF文件的属性,如作者、标题等元数据,...
### Java打印PDF文件及批量打印实现 #### 一、引言 在企业级应用开发中,经常需要处理各种文档操作,其中包括PDF文件的打印。Java作为一种广泛应用的企业级开发语言,提供了多种方式来实现这一功能。本文将详细...
在Java编程环境中,读取PDF文件中的内容是一个常见的任务,特别是在处理文档自动化或者数据分析时。PDF(Portable Document Format)是一种跨平台的文件格式,用于精确地保留文档的格式和内容。下面将详细介绍如何...
然而,为了确保PDF文件的安全性和完整性,有时我们需要对PDF进行电子签字、盖章、添加防伪二维码、水印以及加密。在Java环境下,我们可以利用特定的库来实现这些功能,例如iText库。以下是对这些知识点的详细解释: ...
在Java开发中,生成PDF文件并添加公章图片是一项常见的任务,尤其在电子文档处理和企业自动化流程中。这里,我们探讨如何使用Java实现这一功能,并将生成的文件上传至阿里云存储服务。以下是一些关键知识点: 1. **...
PDF文件添加图片是Java开发中常见的一项任务,特别是在生成报告、文档或证书等场景下,可能需要将图像插入到PDF中以增强可视化效果。这里我们将深入探讨如何使用iTextPDF库来实现在PDF中添加图片的功能。 iTextPDF...
### Java读取PDF文件中的数据 #### 知识点概览 本文将详细介绍如何使用Java语言来读取PDF文件中的文本内容。此方法简洁高效,适用于处理大量的PDF文档。主要涉及的技术栈包括Java编程基础、PDFBox库的使用以及文件I...
在IT行业中,处理PDF...总的来说,Java中读取PDF文件内容主要依赖于第三方库,如Apache PDFBox,同时也可结合命令行工具如XPDF进行操作。根据实际需求,选择合适的方法并结合具体的库和工具,可以高效地处理PDF文件。
这份“java基础pdf文件”显然是一份深入浅出的Java学习资料,源自中关村软件园人才基地,这是一家知名的IT培训机构,其教学资源通常具有较高的专业性和实用性。 在Java基础学习中,首先要理解的是Java的基本语法和...
在Java开发中,生成PDF文件是一项常见的需求,特别是在报表、文档和证书的生成场景中。Itext库是一个广泛使用的开源库,它允许开发者通过简单的API来创建和编辑PDF文档。本篇文章将深入探讨如何利用Itext库在Java中...
这个主题涉及到Java中的iText库,一个强大的PDF处理库,以及如何使用它来创建和操作PDF文档。 首先,iText是Java的一个开源库,主要用于生成和修改PDF文档。在提供的压缩包中,可以看到不同版本的iText库,如iText-...
在Java编程环境中,生成PDF...总的来说,Java生成PDF文件涉及到多个层次的技术,包括文档结构、内容呈现、I/O操作以及安全性等。通过学习和熟练掌握iText库,开发者可以构建功能强大的PDF生成工具,满足各种业务需求。
在Java环境中实现PDF文件的电子签名,主要涉及到数字证书的生成、PDF处理库的使用以及签名的嵌入操作。下面将详细介绍这个过程。 首先,我们需要了解PFX(Personal Information Exchange)证书。PFX是一种包含了...
通过导入这个库,开发者可以在Java程序中直接操作PDF文档。iText提供了丰富的API,包括添加文本、图像、表格、链接、水印等功能,使得创建PDF变得简单易行。 在Java中导出页面为PDF文件,首先需要引入iText库。这...
在Java编程环境中,将一个URL链接的内容转换为PDF文件是一个常见的需求,这通常涉及到网络请求、HTML解析以及PDF生成等多个步骤。以下是一个详细的步骤指南,涵盖了这个过程中的关键知识点: 首先,我们需要处理URL...