开源包下载地址: http://bfo.com/products/download.jsp
例子:
import java.io.File;
import java.io.IOException;
import org.faceless.pdf2.PDF;
import org.faceless.pdf2.PDFParser;
import org.faceless.pdf2.PDFReader;
import org.faceless.pdf2.PageExtractor;
public class Test {
public static void main(String[] args) throws IOException {
// PDF文档路径
String filepath = "rayln的博客文章 (1).pdf";
// PDFReader对象建立
PDFReader reader = new PDFReader(new File(filepath));
// 建立PDF文档对象
PDF pdf = new PDF(reader);
// 建立文档解析对象
PDFParser parser = new PDFParser(pdf);
for (int i = 0; i < pdf.getNumberOfPages(); i++) {
PageExtractor extractor = parser.getPageExtractor(i);
System.out.println("=========start================");
System.out.println(extractor.getTextInDisplayOrder().toArray()[1]);
//System.out.println(extractor.getTextAsStringBuffer());
System.out.println("=========end================");
}
}
}
分享到:
相关推荐
java在线解析xmljava在线解析xmljava在线解析xmljava在线解析xmljava在线解析xmljava在线解析xmljava在线解析xmljava在线解析xmljava在线解析xmljava在线解析xmljava在线解析xmljava在线解析xmljava在线解析xmljava...
Java完美解析PDM,这是一种利用Java编程语言对Power Designer创建的PDM(Physical Data Model,物理数据模型)文件进行解析的技术。PDM是数据库设计工具Power Designer中的一个重要概念,它通常包含了数据库表、列、...
本篇将详细介绍如何使用Java和AAPT(Android Asset Packaging Tool)来解析APK,尤其适用于处理加密或加壳的APK。 首先,APK实际上是一个ZIP格式的压缩包,包含了AndroidManifest.xml、资源文件、dex字节码等。传统...
java解析PDF格式的文件demo。JAVA实现PDF解析,对PDF文件中的文本内容可输出仅供参考学习,不喜勿喷。
【标题】:“java解析DWG文件为json使用superMap” 【描述】:“java使用superMap解析DWG文件为json输出,本地通过,附件中为word操方式按照步骤可以导入数据集” 【标签】:“java解析DWG文件json java读取dwg...
下面将详细介绍如何使用Java进行GRIB2文件的读取和解析。 1. **理解GRIB2文件结构**: GRIB2文件由多个消息组成,每个消息包含一组相关的气象数据。消息由一个固定长度的头部(Header)和可变长度的数据部分(Data...
当涉及到将COBOL系统与Java系统集成时,通常需要进行数据解析和接口转换。以下是对“java解析cobol数据”这一主题的详细讨论。 首先,理解COBOL数据结构是关键。COBOL程序通常使用固定格式的数据文件,这些文件包含...
java读取解析图书MARC数据的iso文件
这是直接使用JAVA来解析Google的KMZ和KML类型文件的主要示例代码和POM.xml,pom.xml中的一些依赖项可以忽略不计。在实际解析过程中用不到,网上大多数资源都是解析的KML,但是对于KMZ文件的在线解析模式,并没有明确...
Java的SQL解析器JSQLPaser是一个强大的开源库,专门设计用于处理SQL语句的解析工作。这个库允许开发者分析SQL语句的结构,提取出其中的关键元素,如列名、表名、别名以及查询条件,从而在Java应用程序中实现对SQL的...
Java实现解析dcm医学影像文件并提取文件信息的方法示例 本文主要介绍了Java实现解析dcm医学影像文件并提取文件信息的方法,结合实例形式分析了Java基于第三方库文件针对dcm医学影像文件的解析操作相关实现技巧。...
### Java对MHT文件解析及内容抓取技术详解 #### 一、引言 MHT(Mime HTML)文件是一种将HTML文档与嵌入资源(如图像、样式表等)合并为一个文件的格式,方便在网络上传输。本文将详细介绍如何使用Java语言解析MHT...
在Java编程语言中,EPUB解析通常通过特定的库或框架来实现,以方便开发者处理这种开放标准的电子书格式。FBreader是一个知名的开源电子书阅读器项目,其源码中包含了对EPUB文件的支持。在本项目中,我们讨论的是从...
Java解析HJ212协议是一项在环保领域中常见的任务,因为HJ212是中国环境保护部制定的一套数据交换标准,主要用于环境监测数据的传输和处理。这个名为"java解析hj212.rar"的压缩包包含了针对HJ212协议的Java实现,覆盖...
java内存解析(讲的很清楚的视频)java内存解析(讲的很清楚的视频)java内存解析(讲的很清楚的视频)java内存解析(讲的很清楚的视频)java内存解析(讲的很清楚的视频)java内存解析(讲的很清楚的视频)java内存...
java解析DXF文件信息,这里涉及到各种转换字符串编码的操作,解决了解析过程中遇到中文的乱码问题,包括circle,ellipse,line,lwpolyline等,还涉及到从DXF文件中读取一个字符串、判断CIRCLE实体、判断ellipse实体、...
总的来说,这份"Java Spring 源码解析 Xmind 思维导图"涵盖了Spring框架的核心组件和设计理念,帮助开发者从源码层面理解Spring的运行机制。通过这样的学习,可以提升开发者对Spring的理解,从而更好地利用Spring...
Java作为一种广泛使用的后端编程语言,提供了多种方式来解析XML文档,使得处理多级嵌套的数据变得可能。本文将详细讲解如何在Java中解析XML,特别是针对多级结构的情况。 首先,Java提供了两种主要的API来处理XML:...
Java解析CHM文件是将Microsoft的 Compiled HTML Help (CHM) 文件转换成HTML网页的过程。CHM文件是一种常见的帮助文档格式,它包含了多个HTML页面、图像和其他资源,并使用了一种特殊的压缩方法存储。在Java中处理CHM...
在本主题中,我们关注的是如何利用Java解析DXF(Drawing Exchange Format)文件,这是一种由AutoCAD软件生成的二进制或ASCII格式的文件,用于存储二维图形数据。DXF文件通常包含各种几何实体,如圆(circle)、椭圆...