`
zhangbaoming815
  • 浏览: 149346 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

java 解析PDF

    博客分类:
  • java
阅读更多

用java读取PDF,这里用到了itext,jar包可以自己上网下载:

 

	public static void readPDF(String path) throws Exception {
		try {

			PdfReader reader = new PdfReader(path);
			int n = reader.getNumberOfPages();
			System.out.println("page number = " + n);
			String str = PdfTextExtractor.getTextFromPage(reader, n); // Extracting
			System.out.println(str);
		} catch (Exception e) {
			System.out.println(e);
		}
	}

用java写入PDF:

 

	public static void writePDF(String path) {
		Document d = new Document();
		try {
			FileOutputStream os = new FileOutputStream(path);
			PdfWriter.getInstance(d, os);
			d.open();
			d.add(new Paragraph("hello PDF"));
		} catch (Exception e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		} finally {
			d.close();
		}
	}

 往PDF中插入图片,图片格式不一样,插入方法略有不同:

 

	public static void writeImageToPDFWithPNG(String filePath, String imagePath) {

		try {
			// Create Document Object
			Document convertPngToPdf = new Document();
			// Create PdfWriter for Document to hold physical file
			// Change the PDF file path to suit to your needs
			PdfWriter.getInstance(convertPngToPdf, new FileOutputStream(
					filePath));
			convertPngToPdf.open();
			// Get the PNG image to Convert to PDF
			// getImage of PngImage class is a static method
			// Edit the file location to suit to your needs
			Image convertBmp = PngImage.getImage(imagePath);
			// Add image to Document
			convertPngToPdf.add(convertBmp);
			// Close Document
			convertPngToPdf.close();
			System.out
					.println("Converted and stamped PNG Image in a PDF Document Using iText and Java");
		} catch (Exception i1) {
			i1.printStackTrace();
		}
	}

	public static void writeIamgeToPDFWithBMP(String filePath, String imagePath) {
		try {
			// Create Document Object
			Document convertBmpToPdf = new Document();
			// Create PdfWriter for Document to hold physical file
			PdfWriter.getInstance(convertBmpToPdf, new FileOutputStream(
					filePath));
			convertBmpToPdf.open();
			// Get the Bitmap image to Convert to PDF
			// getImage is a static method, does not require object
			Image convertBmp = BmpImage.getImage(imagePath);
			// Add image to Document
			convertBmpToPdf.add(convertBmp);
			// Close Document
			convertBmpToPdf.close();
			System.out.println("Successfully Converted BMP to PDF in iText");
		} catch (Exception i1) {
			i1.printStackTrace();
		}
	}

	public static void writeIamgeToPDFWithJEPG(String filePath, String imagePath) {
		Document doc = new Document();
		Image jpeg;
		try {
			PdfWriter.getInstance(doc, new FileOutputStream(filePath));
			doc.open();
			jpeg = Image.getInstance(imagePath);
			// 图片居中
			jpeg.setAlignment(Image.ALIGN_CENTER);
			doc.add(jpeg);
			doc.close();
			System.out.println("Successfully Converted JPEG to PDF in iText");
		} catch (Exception e) {
			e.printStackTrace();
		}
	}
分享到:
评论

相关推荐

    java解析PDF文件

    java解析PDF格式的文件demo。JAVA实现PDF解析,对PDF文件中的文本内容可输出仅供参考学习,不喜勿喷。

    java解析pdf

    Java解析PDF主要依赖于第三方库,如Apache PDFBox、iText、PDFRenderer等。这里我们将重点介绍Apache PDFBox,它是一个开源的Java库,提供了丰富的API来读取、创建、编辑PDF文档。 1. **Apache PDFBox简介** ...

    java解析pdf.rar

    Java解析PDF文件主要涉及到PDF处理库的使用,例如在本案例中使用了Spire.Pdf.Free.jar这个开源库。Spire.Pdf是一个强大的PDF处理工具,可以用于读取、写入、编辑和转换PDF文档。以下是一些关于如何在Java中使用Spire...

    Java解析pdf的工具包pdfbox

    Java解析pdf文件的工具包,对pdf文件进行处理

    java解析 pdf工具包 iText jar包源代码

    Java解析PDF工具包iText是Java开发者在处理PDF文档时常用的一个开源库,它提供了丰富的API,使得在Java程序中创建、编辑、读取PDF文件变得简单易行。iText库以其高效、灵活和功能强大而闻名,尤其在处理复杂的PDF...

    Java 解析 PDF, pdfbox读取PDF内容

    本文将深入探讨如何使用PDFBox库在Java中解析PDF并读取其内容。 PDFBox是Apache软件基金会的一个开源项目,它为Java开发者提供了一系列API来操作PDF文档,包括读取、创建、编辑以及签署PDF等任务。在本示例中,我们...

    Java 解析 pdf文件用到的jar包

    总结来说,Java解析PDF文件的关键在于利用PDFBox和FontBox这两个库。PDFBox提供了一套强大的工具集,用于读取、修改和创建PDF文档,而FontBox则专注于处理PDF中的字体,确保文本的正确呈现。通过熟练掌握这两个库,...

    java创建和解析PDF

    接下来,我们将探讨如何使用Java解析PDF文件为TXT文本。同样,可以使用Apache PDFBox库来实现这一功能。以下是一个基本的PDF解析示例: 1. 打开PDF文档:使用`PDDocument`加载PDF文件。 ```java PDDocument ...

    java解析pdf,word,ppt,excel 源码

    ### Java解析PDF文档 首先,我们看到一个名为`Pdf2text`的类,它使用了Apache PDFBox库来读取PDF文档并提取其中的文字。PDFBox是一个开源的Java库,用于读写PDF文档,支持多种PDF操作,包括文本提取、图像提取、元...

    java解析pdf实例

    总结,这个实例展示了如何利用jsoup抓取网页上的PDF资源,并通过PDFBox解析PDF内容。尽管这不是jsoup的主要用途,但通过巧妙结合,可以实现从网页上获取并处理PDF文档的完整流程。在实际应用中,这样的组合可以用于...

    java解析pdf框架pdfbox

    要解析PDF文档,首先需要加载文档: ```java PDDocument document = PDDocument.load(new File("123.pdf")); ``` 然后可以使用PDFTextStripper来提取文本: ```java PDFTextStripper stripper = new ...

    pdfbox java解析pdf文档jar包+源代码+帮助文档+example

    本资源包含PDFBox的Java解析PDF文档所需的jar包,源代码,帮助文档以及示例(example),对于学习和使用PDFBox进行PDF操作具有极大的帮助。 首先,让我们深入了解一下PDFBox的主要功能: 1. **读取PDF文档**:...

    Java解析PDF文件源代码(代码中有详细注释)

    本篇将详细介绍如何使用Java解析PDF文件,特别是通过提供的源代码进行操作。 首先,Java解析PDF文件通常需要依赖特定的库,例如Apache PDFBox。在这个压缩包中,我们找到了PDFBox-0.6.6.jar,这是Apache PDFBox的一...

    Java 解析pdf源码(含详细注释和依赖jar)

    本篇将深入探讨如何使用Java解析PDF源码,特别关注含详细注释的源码及其相关依赖jar文件。 首先,我们需要了解的是Java中的PDF解析库,如iText、Apache PDFBox和PDF Clown等。这里提到的源码很可能基于这些库之一。...

    java解析pdf工具bfopdf-2.11.11.zip

    Java解析PDF工具BFOPDF是用于处理PDF文档的开源库,特别适用于Java开发环境。BFOPDF库的主要功能包括读取、解析、编辑以及创建PDF文档。在版本2.11.11中,它提供了丰富的API和功能,使得开发者能够高效地与PDF文件...

    JAVA 解析电子发票 解析PDF 精准读取想要的数据 源码+JAR包

    最近有个项目是要求将PDF版的电子发票,解析成文本格式,要求各个名称都对应,刚开始用的是PDFTextStripper.getText(),发现不能准确的抓到自己想要的数据,后来想了个办法,使用Rectangle,画多个矩形,精准定位,...

    java使用itext解析pdf并生成文本文件—eclipse工程

    在这个“java使用iText解析pdf并生成文本文件—eclipse工程”中,我们将探讨如何利用iText库在Java环境中,特别是在Eclipse集成开发环境中,解析PDF文档并将其内容导出为文本文件。 首先,我们需要理解PDF...

    Java解析pdf,zip,doc等格式文档

    Java作为一种多用途的编程语言,提供了丰富的库和工具来解析PDF、ZIP、DOC和XLS等格式的文件。下面将详细介绍这些格式的解析方法。 首先,PDF(Portable Document Format)是一种用于存储和交换文档的格式,由Adobe...

    java解析PDF所需的基础jar包

    在你提供的压缩包文件中,包含了一些关键的Java库,它们是用于解析PDF的关键组件。以下是关于这些库和如何使用它们进行PDF操作的详细知识点: 1. **PDFBox**: PDFBox是Apache软件基金会的一个开源项目,提供了...

    java 解析pdf的两个文件包

    在Java中,解析PDF文件通常需要借助特定的库。本篇文章将深入探讨两个用于Java的PDF解析工具:XPDF和PDFBox,并提供相关示例程序。 首先,我们来看XPDF。XPDF是一个开源的PDF工具集,它主要由命令行工具组成,如...

Global site tag (gtag.js) - Google Analytics