`
rayln
  • 浏览: 441698 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

Java的bfopdf解析

    博客分类:
  • Java
 
阅读更多
开源包下载地址: http://bfo.com/products/download.jsp

例子:
import java.io.File;
import java.io.IOException;

import org.faceless.pdf2.PDF;
import org.faceless.pdf2.PDFParser;
import org.faceless.pdf2.PDFReader;
import org.faceless.pdf2.PageExtractor;

public class Test {
	public static void main(String[] args) throws IOException {
		// PDF文档路径
		String filepath = "rayln的博客文章 (1).pdf";
		// PDFReader对象建立
		PDFReader reader = new PDFReader(new File(filepath));
		// 建立PDF文档对象
		PDF pdf = new PDF(reader);
		// 建立文档解析对象
		PDFParser parser = new PDFParser(pdf);
		for (int i = 0; i < pdf.getNumberOfPages(); i++) {
			PageExtractor extractor = parser.getPageExtractor(i);
			System.out.println("=========start================");
			System.out.println(extractor.getTextInDisplayOrder().toArray()[1]);
			//System.out.println(extractor.getTextAsStringBuffer());
			System.out.println("=========end================");
		}
	}
}
分享到:
评论

相关推荐

    java在线解析xmljava在线解析xmljava在线解析xmljava在线解析xml

    java在线解析xmljava在线解析xmljava在线解析xmljava在线解析xmljava在线解析xmljava在线解析xmljava在线解析xmljava在线解析xmljava在线解析xmljava在线解析xmljava在线解析xmljava在线解析xmljava在线解析xmljava...

    java解析pdf工具bfopdf-2.11.11.zip

    Java解析PDF工具BFOPDF是用于处理PDF文档的开源库,特别适用于Java开发环境。BFOPDF库的主要功能包括读取、解析、编辑以及创建PDF文档。在版本2.11.11中,它提供了丰富的API和功能,使得开发者能够高效地与PDF文件...

    java 公式解析源码

    Java公式解析源码是用于处理数学、统计或业务逻辑中的表达式解析的代码库。它允许用户自定义公式,使得程序能够动态计算基于特定输入的数据。在Java开发中,这样的库通常用于财务软件、数据分析应用或者任何需要进行...

    java完美解析pdm

    Java完美解析PDM,这是一种利用Java编程语言对Power Designer创建的PDM(Physical Data Model,物理数据模型)文件进行解析的技术。PDM是数据库设计工具Power Designer中的一个重要概念,它通常包含了数据库表、列、...

    java实现解析APK

    本篇将详细介绍如何使用Java和AAPT(Android Asset Packaging Tool)来解析APK,尤其适用于处理加密或加壳的APK。 首先,APK实际上是一个ZIP格式的压缩包,包含了AndroidManifest.xml、资源文件、dex字节码等。传统...

    JAVA解析DBC文件

    在JAVA中解析DBC文件,首先需要读取文件内容,然后按照DBC的语法规则进行解析。这通常涉及到字符串分割、正则表达式匹配等操作。解析过程中要注意处理大小端问题,因为在不同的硬件平台上,数据存储的顺序可能不同。...

    java解析PDF文件

    java解析PDF格式的文件demo。JAVA实现PDF解析,对PDF文件中的文本内容可输出仅供参考学习,不喜勿喷。

    Java读取解析GRIB2文件

    下面将详细介绍如何使用Java进行GRIB2文件的读取和解析。 1. **理解GRIB2文件结构**: GRIB2文件由多个消息组成,每个消息包含一组相关的气象数据。消息由一个固定长度的头部(Header)和可变长度的数据部分(Data...

    java读取解析图书MARC数据iso文件

    java读取解析图书MARC数据的iso文件

    java解析cobol数据

    当涉及到将COBOL系统与Java系统集成时,通常需要进行数据解析和接口转换。以下是对“java解析cobol数据”这一主题的详细讨论。 首先,理解COBOL数据结构是关键。COBOL程序通常使用固定格式的数据文件,这些文件包含...

    纯用JAVA解析Google的KMZ和KML空间数据的示例代码

    这是直接使用JAVA来解析Google的KMZ和KML类型文件的主要示例代码和POM.xml,pom.xml中的一些依赖项可以忽略不计。在实际解析过程中用不到,网上大多数资源都是解析的KML,但是对于KMZ文件的在线解析模式,并没有明确...

    java的sql解析器jsqlparser

    Java的SQL解析器JSQLPaser是一个强大的开源库,专门设计用于处理SQL语句的解析工作。这个库允许开发者分析SQL语句的结构,提取出其中的关键元素,如列名、表名、别名以及查询条件,从而在Java应用程序中实现对SQL的...

    java对mht文件解析

    ### Java对MHT文件解析及内容抓取技术详解 #### 一、引言 MHT(Mime HTML)文件是一种将HTML文档与嵌入资源(如图像、样式表等)合并为一个文件的格式,方便在网络上传输。本文将详细介绍如何使用Java语言解析MHT...

    Java实现解析dcm医学影像文件并提取文件信息的方法示例

    Java实现解析dcm医学影像文件并提取文件信息的方法示例 本文主要介绍了Java实现解析dcm医学影像文件并提取文件信息的方法,结合实例形式分析了Java基于第三方库文件针对dcm医学影像文件的解析操作相关实现技巧。...

    yaml文件解析(java)

    本文将深入探讨如何在Java中解析YAML文件,包括依赖管理、封装解析类以及源码分析。 首先,为了在Java项目中使用YAML解析功能,我们需要引入相关的库。在Maven项目中,可以在`pom.xml`文件中添加SnakeYAML的依赖: ...

    java XML解析方式实现自动生成word文档

    本篇文章将详细探讨如何利用Java和XML解析来自动化创建Word文档。 首先,我们需要了解XML的结构。XML(Extensible Markup Language)是一种标记语言,它允许我们以结构化的方式存储数据。在生成Word文档时,我们...

    java 解析 chm 文件

    Java解析CHM文件是将Microsoft的 Compiled HTML Help (CHM) 文件转换成HTML网页的过程。CHM文件是一种常见的帮助文档格式,它包含了多个HTML页面、图像和其他资源,并使用了一种特殊的压缩方法存储。在Java中处理CHM...

    java解析hj212.rar

    Java解析HJ212协议是一项在环保领域中常见的任务,因为HJ212是中国环境保护部制定的一套数据交换标准,主要用于环境监测数据的传输和处理。这个名为"java解析hj212.rar"的压缩包包含了针对HJ212协议的Java实现,覆盖...

    java内存解析(讲的很清楚的视频)

    java内存解析(讲的很清楚的视频)java内存解析(讲的很清楚的视频)java内存解析(讲的很清楚的视频)java内存解析(讲的很清楚的视频)java内存解析(讲的很清楚的视频)java内存解析(讲的很清楚的视频)java内存...

    java读取解析DXF文件信息.rar

    java解析DXF文件信息,这里涉及到各种转换字符串编码的操作,解决了解析过程中遇到中文的乱码问题,包括circle,ellipse,line,lwpolyline等,还涉及到从DXF文件中读取一个字符串、判断CIRCLE实体、判断ellipse实体、...

Global site tag (gtag.js) - Google Analytics