开源包下载地址: http://bfo.com/products/download.jsp
例子:
import java.io.File;
import java.io.IOException;
import org.faceless.pdf2.PDF;
import org.faceless.pdf2.PDFParser;
import org.faceless.pdf2.PDFReader;
import org.faceless.pdf2.PageExtractor;
public class Test {
public static void main(String[] args) throws IOException {
// PDF文档路径
String filepath = "rayln的博客文章 (1).pdf";
// PDFReader对象建立
PDFReader reader = new PDFReader(new File(filepath));
// 建立PDF文档对象
PDF pdf = new PDF(reader);
// 建立文档解析对象
PDFParser parser = new PDFParser(pdf);
for (int i = 0; i < pdf.getNumberOfPages(); i++) {
PageExtractor extractor = parser.getPageExtractor(i);
System.out.println("=========start================");
System.out.println(extractor.getTextInDisplayOrder().toArray()[1]);
//System.out.println(extractor.getTextAsStringBuffer());
System.out.println("=========end================");
}
}
}
分享到:
相关推荐
Java解析PDF工具BFOPDF是用于处理PDF文档的开源库,特别适用于Java开发环境。BFOPDF库的主要功能包括读取、解析、编辑以及创建PDF文档。在版本2.11.11中,它提供了丰富的API和功能,使得开发者能够高效地与PDF文件...
本篇将详细介绍如何使用Java和AAPT(Android Asset Packaging Tool)来解析APK,尤其适用于处理加密或加壳的APK。 首先,APK实际上是一个ZIP格式的压缩包,包含了AndroidManifest.xml、资源文件、dex字节码等。传统...
在JAVA中解析DBC文件,首先需要读取文件内容,然后按照DBC的语法规则进行解析。这通常涉及到字符串分割、正则表达式匹配等操作。解析过程中要注意处理大小端问题,因为在不同的硬件平台上,数据存储的顺序可能不同。...
java读取解析图书MARC数据的iso文件
本文将深入探讨如何在Java中解析JSON字符串,以满足后端处理前端传递的数据需求。 首先,理解JSON的基本结构至关重要。JSON格式通常包含键值对,可以是对象(用花括号 `{}` 包裹)或数组(用方括号 `[]` 包裹)。...
当涉及到将COBOL系统与Java系统集成时,通常需要进行数据解析和接口转换。以下是对“java解析cobol数据”这一主题的详细讨论。 首先,理解COBOL数据结构是关键。COBOL程序通常使用固定格式的数据文件,这些文件包含...
Java的SQL解析器JSQLPaser是一个强大的开源库,专门设计用于处理SQL语句的解析工作。这个库允许开发者分析SQL语句的结构,提取出其中的关键元素,如列名、表名、别名以及查询条件,从而在Java应用程序中实现对SQL的...
Java作为一种强大的编程语言,提供了多种库和方法来处理PDF文件,包括创建和解析PDF。本篇将详细介绍如何在Java环境下创建PDF文件以及将PDF解析为TXT文本。 首先,我们来看如何使用Java创建PDF文件。通常,我们可以...
java内存解析(讲的很清楚的视频)java内存解析(讲的很清楚的视频)java内存解析(讲的很清楚的视频)java内存解析(讲的很清楚的视频)java内存解析(讲的很清楚的视频)java内存解析(讲的很清楚的视频)java内存...
Java作为一种广泛使用的后端编程语言,提供了多种方式来解析XML文档,使得处理多级嵌套的数据变得可能。本文将详细讲解如何在Java中解析XML,特别是针对多级结构的情况。 首先,Java提供了两种主要的API来处理XML:...
java解析DXF文件信息,这里涉及到各种转换字符串编码的操作,解决了解析过程中遇到中文的乱码问题,包括circle,ellipse,line,lwpolyline等,还涉及到从DXF文件中读取一个字符串、判断CIRCLE实体、判断ellipse实体、...
在Java编程环境中,音频解析是一项重要的任务,它涉及到读取、处理和理解音频文件的内部结构。本篇文章将深入探讨如何使用Java进行音频解析,并提供相关的代码示例。我们将主要关注以下几个方面:音频文件格式、Java...
Java解析NC格点预报涉及到的是气象学中的数值预报(Numerical Weather Prediction, NWP)领域,结合了计算机科学与大气科学。NC文件是NetCDF(Network Common Data Form)的缩写,是一种用于存储多维科学数据的标准...
Java解析CHM文件是将Microsoft的 Compiled HTML Help (CHM) 文件转换成HTML网页的过程。CHM文件是一种常见的帮助文档格式,它包含了多个HTML页面、图像和其他资源,并使用了一种特殊的压缩方法存储。在Java中处理CHM...
Java表达式语法解析库Parboiled是一个强大的工具,用于在Java平台上构建自定义的解析器。这个库由Sirthias开发,它引入了一种新的、更简洁的方式来编写解析规则,使得解析器的创建过程变得更加简单和高效。Parboiled...
本篇文章将详细讲解如何使用`meteoInfo`和`geotools`这两个Java库来解析`shp`文件,提取其中的数据,并获取边界线数据、中心点坐标以及最大和最小经纬度值。 `meteoInfo`是一个专门处理气象数据的Java库,虽然它的...
Java CHM解析主要涉及到的是如何在Java环境中处理和解析Windows平台下的 Compiled Help Module (CHM) 文件。CHM文件是微软提供的一种用于存储帮助文档的格式,它将多个HTML文件、图片和其他资源压缩在一个单一的文件...
在本Java小项目中,我们聚焦于歌词解析,这是一个典型的文本处理任务,涉及到文件操作、I/O流处理以及集合框架的运用。以下是对这些技术的详细说明: 首先,文件操作是程序与本地文件系统交互的基础。在Java中,...
在这个场景中,我们关注的是如何使用Java语言来解析气象云图数据,特别是AWX格式的文件。AWX格式是气象学中用于存储和传输气象图像数据的一种标准格式,它包含了丰富的气象信息,如温度、湿度、风速等。下面我们将...
在IT行业中,Java是一种广泛应用的编程语言,尤其在处理数据解析和服务器端开发时。ArcGIS则是Esri公司推出的一款强大的地理信息系统,用于地图制作、地理数据分析和空间信息管理。当我们需要在Java环境下操作和解析...