`

java操作pdf文件

 
阅读更多

要读取pdf文件,必须有pdfbox1.7.1.jar和fontbox1.7.1.jar,可以到官网下,也可以到我的资源里下,下面代码

import java.io.FileWriter;
import java.io.IOException;
import java.io.PrintWriter;

import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.util.PDFTextStripper;

public class Mytest {
	public static String getText(String file) {
		String s = "";
		String pdffile = file;
		PDDocument pdfdoc = null;
		try {
			pdfdoc = PDDocument.load(pdffile);
			PDFTextStripper stripper = new PDFTextStripper();
			s = stripper.getText(pdfdoc);
		} catch (IOException e) {
			e.printStackTrace();
		} finally {
			try {
				if (pdfdoc != null) {
					pdfdoc.close();
				}
			} catch (IOException e) {
				e.printStackTrace();
			}
		}
		return s;
	}

	public static void toTextFile(String doc, String filename) throws Exception {
		String pdffile = doc;
		PDDocument pdfdoc = null;
		PrintWriter pw = null;
		try {
			pdfdoc = PDDocument.load(pdffile);
			PDFTextStripper stripper = new PDFTextStripper();
			pw = new PrintWriter(new FileWriter(filename));
			stripper.writeText(pdfdoc, pw);

		} catch (IOException e) {
			e.printStackTrace();
		} finally {
			try {
				if(pw!=null){
					pw.close();
				}
				if (pdfdoc != null) {
					pdfdoc.close();
				}
			} catch (IOException e) {
				e.printStackTrace();
			}
		}

	}

	public static void main(String[] args) {
		try {
			String sc = getText("在这里输入要转换的pdf文件路径");
			System.out.print(sc);
			toTextFile("在这里输入要转换的pdf文件路径",
					"要保存的txt文件路径");
		} catch (Exception e) {
			e.printStackTrace();
		}

	}

}


分享到:
评论

相关推荐

    java_pdf.rar_JAVA.pdf _java pdf_java操作pdf

    描述中的"一个java操作pdf文件的开发包,很好用的"进一步确认了这个压缩包包含了一个实用的Java PDF处理库,可能是iText的示例代码或者封装好的API,方便开发者快速上手。 标签"java.pdf_ java_pdf java操作pdf"则...

    JAVA操作PDF文件的第三方包-iText

    然后,可以通过以下步骤操作PDF: 1. **创建PDF**:通过`Document`对象创建一个新的PDF文档,设置文档的边距和页面大小。 2. **添加内容**:使用`Paragraph`、`Font`、`Chunk`等类,添加文本、设置字体和字号。对于...

    Java 读取PDF文件

    在Java编程环境中,读取PDF文件是一项常见的任务,特别是在开发桌面应用或需要处理PDF文档内容时。本篇文章将深入探讨如何使用Java来读取PDF文件,并将其内容展示在一个由JFrame和JPanel构建的GUI窗口中。 首先,...

    java读取pdf文件属性

    在IT领域,特别是Java编程中,读取PDF文件的元数据是一项常见的需求,尤其是在文档管理、内容管理系统或任何需要处理大量文档的应用场景中。本文将深入探讨如何使用Java读取PDF文件的属性,如作者、标题等元数据,...

    java 打印pdf文件 也可批量打印

    ### Java打印PDF文件及批量打印实现 #### 一、引言 在企业级应用开发中,经常需要处理各种文档操作,其中包括PDF文件的打印。Java作为一种广泛应用的企业级开发语言,提供了多种方式来实现这一功能。本文将详细...

    java 读取PDF文件中的内容

    在Java编程环境中,读取PDF文件中的内容是一个常见的任务,特别是在处理文档自动化或者数据分析时。PDF(Portable Document Format)是一种跨平台的文件格式,用于精确地保留文档的格式和内容。下面将详细介绍如何...

    java实现pdf文件的电子签字+盖章+防伪二维码+水印+PDF文件加密

    然而,为了确保PDF文件的安全性和完整性,有时我们需要对PDF进行电子签字、盖章、添加防伪二维码、水印以及加密。在Java环境下,我们可以利用特定的库来实现这些功能,例如iText库。以下是对这些知识点的详细解释: ...

    Java 生成pdf文件加盖公章图片,上传阿里云

    在Java开发中,生成PDF文件并添加公章图片是一项常见的任务,尤其在电子文档处理和企业自动化流程中。这里,我们探讨如何使用Java实现这一功能,并将生成的文件上传至阿里云存储服务。以下是一些关键知识点: 1. **...

    java实现PDF文件添加图片

    PDF文件添加图片是Java开发中常见的一项任务,特别是在生成报告、文档或证书等场景下,可能需要将图像插入到PDF中以增强可视化效果。这里我们将深入探讨如何使用iTextPDF库来实现在PDF中添加图片的功能。 iTextPDF...

    Java 读取pdf文件中的数据

    ### Java读取PDF文件中的数据 #### 知识点概览 本文将详细介绍如何使用Java语言来读取PDF文件中的文本内容。此方法简洁高效,适用于处理大量的PDF文档。主要涉及的技术栈包括Java编程基础、PDFBox库的使用以及文件I...

    强悍的java读取PDF文件

    在IT行业中,处理PDF...总的来说,Java中读取PDF文件内容主要依赖于第三方库,如Apache PDFBox,同时也可结合命令行工具如XPDF进行操作。根据实际需求,选择合适的方法并结合具体的库和工具,可以高效地处理PDF文件。

    java基础pdf文件

    这份“java基础pdf文件”显然是一份深入浅出的Java学习资料,源自中关村软件园人才基地,这是一家知名的IT培训机构,其教学资源通常具有较高的专业性和实用性。 在Java基础学习中,首先要理解的是Java的基本语法和...

    java生成pdf文件分页输出并添加水印

    在Java开发中,生成PDF文件是一项常见的需求,特别是在报表、文档和证书的生成场景中。Itext库是一个广泛使用的开源库,它允许开发者通过简单的API来创建和编辑PDF文档。本篇文章将深入探讨如何利用Itext库在Java中...

    java生成pdf文件

    这个主题涉及到Java中的iText库,一个强大的PDF处理库,以及如何使用它来创建和操作PDF文档。 首先,iText是Java的一个开源库,主要用于生成和修改PDF文档。在提供的压缩包中,可以看到不同版本的iText库,如iText-...

    java 生成PDF文件

    在Java编程环境中,生成PDF...总的来说,Java生成PDF文件涉及到多个层次的技术,包括文档结构、内容呈现、I/O操作以及安全性等。通过学习和熟练掌握iText库,开发者可以构建功能强大的PDF生成工具,满足各种业务需求。

    java实现pdf文件电子签名

    在Java环境中实现PDF文件的电子签名,主要涉及到数字证书的生成、PDF处理库的使用以及签名的嵌入操作。下面将详细介绍这个过程。 首先,我们需要了解PFX(Personal Information Exchange)证书。PFX是一种包含了...

    java打印pdf文件

    通过导入这个库,开发者可以在Java程序中直接操作PDF文档。iText提供了丰富的API,包括添加文本、图像、表格、链接、水印等功能,使得创建PDF变得简单易行。 在Java中导出页面为PDF文件,首先需要引入iText库。这...

    java URL转PDF文件

    在Java编程环境中,将一个URL链接的内容转换为PDF文件是一个常见的需求,这通常涉及到网络请求、HTML解析以及PDF生成等多个步骤。以下是一个详细的步骤指南,涵盖了这个过程中的关键知识点: 首先,我们需要处理URL...

Global site tag (gtag.js) - Google Analytics