`
rayln
  • 浏览: 424300 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

Java的bfopdf解析

    博客分类:
  • Java
 
阅读更多
开源包下载地址: http://bfo.com/products/download.jsp

例子:
import java.io.File;
import java.io.IOException;

import org.faceless.pdf2.PDF;
import org.faceless.pdf2.PDFParser;
import org.faceless.pdf2.PDFReader;
import org.faceless.pdf2.PageExtractor;

public class Test {
	public static void main(String[] args) throws IOException {
		// PDF文档路径
		String filepath = "rayln的博客文章 (1).pdf";
		// PDFReader对象建立
		PDFReader reader = new PDFReader(new File(filepath));
		// 建立PDF文档对象
		PDF pdf = new PDF(reader);
		// 建立文档解析对象
		PDFParser parser = new PDFParser(pdf);
		for (int i = 0; i < pdf.getNumberOfPages(); i++) {
			PageExtractor extractor = parser.getPageExtractor(i);
			System.out.println("=========start================");
			System.out.println(extractor.getTextInDisplayOrder().toArray()[1]);
			//System.out.println(extractor.getTextAsStringBuffer());
			System.out.println("=========end================");
		}
	}
}
分享到:
评论

相关推荐

    java在线解析xmljava在线解析xmljava在线解析xmljava在线解析xml

    java在线解析xmljava在线解析xmljava在线解析xmljava在线解析xmljava在线解析xmljava在线解析xmljava在线解析xmljava在线解析xmljava在线解析xmljava在线解析xmljava在线解析xmljava在线解析xmljava在线解析xmljava...

    java解析pdf工具bfopdf-2.11.11.zip

    Java解析PDF工具BFOPDF是用于处理PDF文档的开源库,特别适用于Java开发环境。BFOPDF库的主要功能包括读取、解析、编辑以及创建PDF文档。在版本2.11.11中,它提供了丰富的API和功能,使得开发者能够高效地与PDF文件...

    java 公式解析源码

    Java公式解析源码是用于处理数学、统计或业务逻辑中的表达式解析的代码库。它允许用户自定义公式,使得程序能够动态计算基于特定输入的数据。在Java开发中,这样的库通常用于财务软件、数据分析应用或者任何需要进行...

    java读取解析图书MARC数据iso文件

    java读取解析图书MARC数据的iso文件

    JAVA解析DBC文件

    在JAVA中解析DBC文件,首先需要读取文件内容,然后按照DBC的语法规则进行解析。这通常涉及到字符串分割、正则表达式匹配等操作。解析过程中要注意处理大小端问题,因为在不同的硬件平台上,数据存储的顺序可能不同。...

    java解析DWG文件为json使用superMap

    【标题】:“java解析DWG文件为json使用superMap” 【描述】:“java使用superMap解析DWG文件为json输出,本地通过,附件中为word操方式按照步骤可以导入数据集” 【标签】:“java解析DWG文件json java读取dwg...

    Java读取解析GRIB2文件

    下面将详细介绍如何使用Java进行GRIB2文件的读取和解析。 1. **理解GRIB2文件结构**: GRIB2文件由多个消息组成,每个消息包含一组相关的气象数据。消息由一个固定长度的头部(Header)和可变长度的数据部分(Data...

    java解析cobol数据

    当涉及到将COBOL系统与Java系统集成时,通常需要进行数据解析和接口转换。以下是对“java解析cobol数据”这一主题的详细讨论。 首先,理解COBOL数据结构是关键。COBOL程序通常使用固定格式的数据文件,这些文件包含...

    Java实现解析dcm医学影像文件并提取文件信息的方法示例

    Java实现解析dcm医学影像文件并提取文件信息的方法示例 本文主要介绍了Java实现解析dcm医学影像文件并提取文件信息的方法,结合实例形式分析了Java基于第三方库文件针对dcm医学影像文件的解析操作相关实现技巧。...

    java的sql解析器jsqlparser

    Java的SQL解析器JSQLPaser是一个强大的开源库,专门设计用于处理SQL语句的解析工作。这个库允许开发者分析SQL语句的结构,提取出其中的关键元素,如列名、表名、别名以及查询条件,从而在Java应用程序中实现对SQL的...

    java对mht文件解析

    ### Java对MHT文件解析及内容抓取技术详解 #### 一、引言 MHT(Mime HTML)文件是一种将HTML文档与嵌入资源(如图像、样式表等)合并为一个文件的格式,方便在网络上传输。本文将详细介绍如何使用Java语言解析MHT...

    java 解析 json文件 java 解析 json文件

    Java解析JSON文件是Java开发中常见的一项任务,特别是在与Web服务交互或处理API响应时。JSON(JavaScript Object Notation)是一种轻量级的数据交换格式,因其简洁和易于阅读及编写的特点,被广泛应用于网络数据传输...

    java XML解析方式实现自动生成word文档

    本篇文章将详细探讨如何利用Java和XML解析来自动化创建Word文档。 首先,我们需要了解XML的结构。XML(Extensible Markup Language)是一种标记语言,它允许我们以结构化的方式存储数据。在生成Word文档时,我们...

    Java 写的Cron表达式解析

    Java中的Cron表达式解析是Java开发者经常遇到的一项任务,特别是在构建定时任务或者调度系统时。Cron表达式源自Unix的crontab命令,用于设置周期性被执行的任务。它使用一组字符串来描述时间序列,包括秒、分钟、...

    java解析上传的shp文件,包含jar,方法,shp文件

    在Java编程环境中,解析Shapefile(.shp)文件是一项常见的任务,特别是在地理信息系统(GIS)应用中。Shapefile是一种广泛用于存储地理空间数据的开放格式。为了在Java中处理这些文件,我们可以利用开源库GeoTools...

    Java解析SO(ELF)文件

    本篇文章将详细探讨如何使用Java来解析SO(ELF)文件,包括文件头部、程序头部表和节区头部表等关键组成部分。 首先,我们需要理解ELF文件格式的基本概念。ELF是一种广泛使用的Unix和类Unix系统中的可执行文件、...

    java创建和解析PDF

    Java作为一种强大的编程语言,提供了多种库和方法来处理PDF文件,包括创建和解析PDF。本篇将详细介绍如何在Java环境下创建PDF文件以及将PDF解析为TXT文本。 首先,我们来看如何使用Java创建PDF文件。通常,我们可以...

    java内存解析(讲的很清楚的视频)

    java内存解析(讲的很清楚的视频)java内存解析(讲的很清楚的视频)java内存解析(讲的很清楚的视频)java内存解析(讲的很清楚的视频)java内存解析(讲的很清楚的视频)java内存解析(讲的很清楚的视频)java内存...

    java 解析xml 多级

    Java作为一种广泛使用的后端编程语言,提供了多种方式来解析XML文档,使得处理多级嵌套的数据变得可能。本文将详细讲解如何在Java中解析XML,特别是针对多级结构的情况。 首先,Java提供了两种主要的API来处理XML:...

Global site tag (gtag.js) - Google Analytics