`

Itext读取PDF

阅读更多

使用Itext读取PDF

package com.pdfbox.pdf;


import com.itextpdf.text.pdf.PdfReader;
import com.itextpdf.text.pdf.parser.PdfTextExtractor;

/**
 * 使用iText读取PDF
 * @author LGF 2015-01-04
 *
 */
public class ItextReadPDF {
	
	public static void main(String[] args) throws Exception {
		//获取 PdfReader 对象,文件名称要是在classpath中的文件
		PdfReader read = new PdfReader("MyBatis3.2.2中文官方文档.pdf");
		//获取pdf中页数
		int pageCount = read.getNumberOfPages();
		System.out.println("page count : " + pageCount);
		//循环遍历取出内容.
		//PdfTextExtractor.getTextFromPage(read,page)方法调用
		//注意: i要从 1 开始
		for (int i = 1; i <= pageCount ; i++) {
			String content = PdfTextExtractor.getTextFromPage(read, i);
			System.out.println(content);
		}
		read.close();
	}
}

 

分享到:
评论

相关推荐

    Android使用iText生成pdf并读取pdf内容

    在这个场景中,我们将探讨如何利用iText在Android应用中生成PDF以及读取PDF的内容。 首先,我们需要在Android项目中引入iText库。由于Android Studio默认使用Gradle作为构建工具,我们可以在`build.gradle`文件的...

    c# winform Itext 实现PDF导出简单demo

    在C# WinForm应用中,Itext库是一个强大的工具,用于创建、编辑和管理PDF文档。这个简单的demo展示了如何利用Itext库将数据导出为PDF格式,非常适合初学者理解和实践。下面,我们将深入探讨这个知识点,以及如何一...

    利用itext操作pdf从数据库导出大量数据

    iText是一个开源的Java库,它提供了创建、读取、更新和签署PDF文档的功能。它支持多种复杂的PDF操作,如添加文本、图像、表格、超链接等,并且可以进行页面操作、书签管理、数字签名等。 2. **从数据库导出数据**...

    iText PDF pdf文档生成itext5.5.11.zip,itxt-asian5.20.jar,加水印,去水印代码,功能强大。

    你可以通过iText读取PDF文档,获取其中的文字、图像和其他元素,这对于数据提取、文档自动化处理等场景非常有用。例如,通过解析PDF表单数据,可以将其转换为数据库记录,或者提取文本进行分析。 5. 其他源码和文档...

    itext7 pdf转图片

    - iText 7是一个强大的PDF库,支持读取、创建、修改PDF文档。它提供API来处理PDF对象,如页面、段落、表格、图像等。 - PDF文档的结构:PDF由多个对象组成,如页、字体、图像、注释等,这些对象在PDF文件中以XML式...

    itext 生成pdf 目录

    iText 是一个强大的Java库,专门用于创建和修改PDF文档。在PDF文档中,目录(或书签)是用户友好的导航工具,可以帮助读者快速跳转到特定章节或页面。本篇文章将深入探讨如何使用iText来生成PDF的目录。 首先,理解...

    java使用itext导出PDF文本绝对定位(实现方法)

    java使用iText导出PDF文本绝对定位(实现方法) iText是一个流行的Java类库,用于生成PDF文档。下面我们将探讨如何使用iText在Java中导出PDF文本,并实现绝对定位。 iText简介 iText是一个开源的Java类库,用于...

    iTextSharp读取表格数据.rar

    资源包含iText.kernel源码和读取表格数据源码,运行TableExtractionFromPDF项目可查看效果。 iText.kernel版本7.1.3.0 iText.io版本7.1.3.0 原文网址:...

    java读取PDF文本内容工具包 itextpdf-5.4.3 等

    使用iText读取PDF文本内容的基本步骤: - 引入相关jar包,如`iTextpdf-5.4.3.jar`。 - 创建`PdfReader`对象,传入PDF文件路径。 - 创建`PdfTextExtractor`对象,调用`getTextFromPage()`方法,传入页码,获取该...

    Itext删除PDF的图层

    在Itext中,我们需要遍历PDF的结构,找到OCGs,并读取它们的属性,如名称、可见性状态等。`OCGParser`可能包含解析PDF元数据,识别OCGs并存储在适当的数据结构中的逻辑。 **OCGRemover.java** `OCGRemover`类可能...

    java使用itext实现pdf文件下载

    Itext是一个强大的库,它允许开发者在Java环境中创建、编辑和修改PDF文档。本教程将详细讲解如何使用Itext库实现PDF文件的下载,包括通过系统路径下载和通过浏览器下载两种方式。 首先,我们需要了解Itext的基本...

    iText_pdf.rar_iText pdf_itext PDF类

    7. **PDF解析和提取**:除了生成PDF,iText还可以读取和解析现有的PDF文件,从中提取文本和图像信息。 8. **版本兼容性**:iText支持不同版本的PDF规范,从最初的PDF 1.3到最新的PDF 2.0。 在描述中提到的“iText...

    iText操作Pdf简单整理

    4. **图像插入**:可以将JPEG、PNG等格式的图像插入PDF,使用`Image.getInstance()`方法读取图像文件,并添加到文档中。 5. **链接与书签**:创建超链接(`PdfAction`和`PdfAnnotation`)和书签(`PdfOutline`),...

    Itext生成PDF所需要的最全Jar包

    在Java开发中,如果你需要创建、编辑或读取PDF文件,Itext是不可或缺的工具。这个压缩包提供了使用Itext生成PDF所需的全部Jar包,确保你可以一次性导入所有必要的依赖。 1. **Itext核心组件**: - `kernel`:这是...

    利用ITEXT、PDFBOX将PDF转为图片

    2. **读取PDF**:使用ITEXT,你可以通过`PdfReader`类打开并读取PDF文档。`PdfReader`对象提供了访问PDF页面的方法。 ```java PdfReader reader = new PdfReader("path_to_your_pdf"); ``` 3. **获取PDF页面**:...

    freemarker+itext生成PDF

    4. **生成PDF**:使用Itext读取FreeMarker处理后的结果,并将其转换为PDF文档。 在给定的文件列表中,`pom.xml`可能是Maven项目的依赖管理文件,其中会包含FreeMarker和Itext的依赖项。`src`则包含了源代码,可能...

    itext生成PDF开发文档

    对于 PDF 表单,iText 提供了 `PdfAcroForm` 类,你可以创建交互式表单域、设置默认值、读取用户填写的数据等。对于数字签名,`PdfSigner` 类提供了签署 PDF 文档的接口,确保文档的完整性和来源的可信度。 总的来...

    itext实现pdf打印之二

    iText是一款强大的开源Java库,用于处理PDF文档,包括创建、编辑、读取和打印PDF文件。本篇文章将深入探讨如何使用iText库进行PDF打印。 首先,我们需要了解iText的基本概念。iText提供了PDFDocument、PDFPage、PDF...

    itextpdf jar包

    3. **表单处理**:iTextPDF可以处理PDF表单,允许填充、读取和创建交互式表单。这在处理如调查问卷、申请表等场合非常有用。 4. **数字签名和安全性**:iTextPDF提供了数字签名的功能,可以确保PDF文档的完整性和...

    java通过itext操作pdf模板写入pdf合同数据

    - **读取模板**:使用`PdfReader`类读取PDF模板文件,创建`PdfStamper`对象,它允许在模板上进行写入操作。 - **写入数据**:利用`AcroFields`接口,可以填充表单字段或者直接在页面上添加文本、图像。例如,`...

Global site tag (gtag.js) - Google Analytics