用java读取PDF,这里用到了itext,jar包可以自己上网下载:
public static void readPDF(String path) throws Exception {
try {
PdfReader reader = new PdfReader(path);
int n = reader.getNumberOfPages();
System.out.println("page number = " + n);
String str = PdfTextExtractor.getTextFromPage(reader, n); // Extracting
System.out.println(str);
} catch (Exception e) {
System.out.println(e);
}
}
用java写入PDF:
public static void writePDF(String path) {
Document d = new Document();
try {
FileOutputStream os = new FileOutputStream(path);
PdfWriter.getInstance(d, os);
d.open();
d.add(new Paragraph("hello PDF"));
} catch (Exception e) {
// TODO Auto-generated catch block
e.printStackTrace();
} finally {
d.close();
}
}
往PDF中插入图片,图片格式不一样,插入方法略有不同:
public static void writeImageToPDFWithPNG(String filePath, String imagePath) {
try {
// Create Document Object
Document convertPngToPdf = new Document();
// Create PdfWriter for Document to hold physical file
// Change the PDF file path to suit to your needs
PdfWriter.getInstance(convertPngToPdf, new FileOutputStream(
filePath));
convertPngToPdf.open();
// Get the PNG image to Convert to PDF
// getImage of PngImage class is a static method
// Edit the file location to suit to your needs
Image convertBmp = PngImage.getImage(imagePath);
// Add image to Document
convertPngToPdf.add(convertBmp);
// Close Document
convertPngToPdf.close();
System.out
.println("Converted and stamped PNG Image in a PDF Document Using iText and Java");
} catch (Exception i1) {
i1.printStackTrace();
}
}
public static void writeIamgeToPDFWithBMP(String filePath, String imagePath) {
try {
// Create Document Object
Document convertBmpToPdf = new Document();
// Create PdfWriter for Document to hold physical file
PdfWriter.getInstance(convertBmpToPdf, new FileOutputStream(
filePath));
convertBmpToPdf.open();
// Get the Bitmap image to Convert to PDF
// getImage is a static method, does not require object
Image convertBmp = BmpImage.getImage(imagePath);
// Add image to Document
convertBmpToPdf.add(convertBmp);
// Close Document
convertBmpToPdf.close();
System.out.println("Successfully Converted BMP to PDF in iText");
} catch (Exception i1) {
i1.printStackTrace();
}
}
public static void writeIamgeToPDFWithJEPG(String filePath, String imagePath) {
Document doc = new Document();
Image jpeg;
try {
PdfWriter.getInstance(doc, new FileOutputStream(filePath));
doc.open();
jpeg = Image.getInstance(imagePath);
// 图片居中
jpeg.setAlignment(Image.ALIGN_CENTER);
doc.add(jpeg);
doc.close();
System.out.println("Successfully Converted JPEG to PDF in iText");
} catch (Exception e) {
e.printStackTrace();
}
}
分享到:
相关推荐
java解析PDF格式的文件demo。JAVA实现PDF解析,对PDF文件中的文本内容可输出仅供参考学习,不喜勿喷。
Java解析PDF主要依赖于第三方库,如Apache PDFBox、iText、PDFRenderer等。这里我们将重点介绍Apache PDFBox,它是一个开源的Java库,提供了丰富的API来读取、创建、编辑PDF文档。 1. **Apache PDFBox简介** ...
Java解析PDF文件主要涉及到PDF处理库的使用,例如在本案例中使用了Spire.Pdf.Free.jar这个开源库。Spire.Pdf是一个强大的PDF处理工具,可以用于读取、写入、编辑和转换PDF文档。以下是一些关于如何在Java中使用Spire...
Java解析pdf文件的工具包,对pdf文件进行处理
Java解析PDF工具包iText是Java开发者在处理PDF文档时常用的一个开源库,它提供了丰富的API,使得在Java程序中创建、编辑、读取PDF文件变得简单易行。iText库以其高效、灵活和功能强大而闻名,尤其在处理复杂的PDF...
本文将深入探讨如何使用PDFBox库在Java中解析PDF并读取其内容。 PDFBox是Apache软件基金会的一个开源项目,它为Java开发者提供了一系列API来操作PDF文档,包括读取、创建、编辑以及签署PDF等任务。在本示例中,我们...
总结来说,Java解析PDF文件的关键在于利用PDFBox和FontBox这两个库。PDFBox提供了一套强大的工具集,用于读取、修改和创建PDF文档,而FontBox则专注于处理PDF中的字体,确保文本的正确呈现。通过熟练掌握这两个库,...
接下来,我们将探讨如何使用Java解析PDF文件为TXT文本。同样,可以使用Apache PDFBox库来实现这一功能。以下是一个基本的PDF解析示例: 1. 打开PDF文档:使用`PDDocument`加载PDF文件。 ```java PDDocument ...
总结,这个实例展示了如何利用jsoup抓取网页上的PDF资源,并通过PDFBox解析PDF内容。尽管这不是jsoup的主要用途,但通过巧妙结合,可以实现从网页上获取并处理PDF文档的完整流程。在实际应用中,这样的组合可以用于...
要解析PDF文档,首先需要加载文档: ```java PDDocument document = PDDocument.load(new File("123.pdf")); ``` 然后可以使用PDFTextStripper来提取文本: ```java PDFTextStripper stripper = new ...
本资源包含PDFBox的Java解析PDF文档所需的jar包,源代码,帮助文档以及示例(example),对于学习和使用PDFBox进行PDF操作具有极大的帮助。 首先,让我们深入了解一下PDFBox的主要功能: 1. **读取PDF文档**:...
### Java解析PDF文档 首先,我们看到一个名为`Pdf2text`的类,它使用了Apache PDFBox库来读取PDF文档并提取其中的文字。PDFBox是一个开源的Java库,用于读写PDF文档,支持多种PDF操作,包括文本提取、图像提取、元...
本篇将详细介绍如何使用Java解析PDF文件,特别是通过提供的源代码进行操作。 首先,Java解析PDF文件通常需要依赖特定的库,例如Apache PDFBox。在这个压缩包中,我们找到了PDFBox-0.6.6.jar,这是Apache PDFBox的一...
本篇将深入探讨如何使用Java解析PDF源码,特别关注含详细注释的源码及其相关依赖jar文件。 首先,我们需要了解的是Java中的PDF解析库,如iText、Apache PDFBox和PDF Clown等。这里提到的源码很可能基于这些库之一。...
Java解析PDF工具BFOPDF是用于处理PDF文档的开源库,特别适用于Java开发环境。BFOPDF库的主要功能包括读取、解析、编辑以及创建PDF文档。在版本2.11.11中,它提供了丰富的API和功能,使得开发者能够高效地与PDF文件...
最近有个项目是要求将PDF版的电子发票,解析成文本格式,要求各个名称都对应,刚开始用的是PDFTextStripper.getText(),发现不能准确的抓到自己想要的数据,后来想了个办法,使用Rectangle,画多个矩形,精准定位,...
在这个“java使用iText解析pdf并生成文本文件—eclipse工程”中,我们将探讨如何利用iText库在Java环境中,特别是在Eclipse集成开发环境中,解析PDF文档并将其内容导出为文本文件。 首先,我们需要理解PDF...
Java作为一种多用途的编程语言,提供了丰富的库和工具来解析PDF、ZIP、DOC和XLS等格式的文件。下面将详细介绍这些格式的解析方法。 首先,PDF(Portable Document Format)是一种用于存储和交换文档的格式,由Adobe...
在你提供的压缩包文件中,包含了一些关键的Java库,它们是用于解析PDF的关键组件。以下是关于这些库和如何使用它们进行PDF操作的详细知识点: 1. **PDFBox**: PDFBox是Apache软件基金会的一个开源项目,提供了...