`
virtual_function
  • 浏览: 129330 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

使用Epublib解析EPub文件

阅读更多

Epublib是一个用于处理epub文件的java类库,可以对epub文件进行读写处理;而且提供了一个阅读器,可以直接运行(java -jar 方式),并可以打开epub类型的文件进行阅读;(引用官方网页的一句话:Epublib is a java library for managing epub files. It’s capable of reading and writing epub files programmatically.

 

Epublib 主页:http://www.siegmann.nl/epublib

Epub viewer的地址:https://github.com/downloads/psiegman/epublib/epublib-viewer-latest.jar

在线API:http://www.siegmann.nl/static/epublib/apidocs/

 

 

容易遇到的问题:在epublib的网页上并没有提到epublib所依赖的jar,那么在创建epub文件的时候,就会报如下异常:

 

 

Exception in thread "main" java.lang.NoClassDefFoundError: org/xmlpull/v1/XmlPullParserFactory
	at nl.siegmann.epublib.epub.EpubProcessorSupport.createXmlSerializer(EpubProcessorSupport.java:80)
	at nl.siegmann.epublib.epub.EpubProcessorSupport.createXmlSerializer(EpubProcessorSupport.java:74)
	at nl.siegmann.epublib.epub.NCXDocument.createNCXResource(NCXDocument.java:181)
	at nl.siegmann.epublib.epub.NCXDocument.createNCXResource(NCXDocument.java:177)
	at nl.siegmann.epublib.epub.EpubWriter.initTOCResource(EpubWriter.java:67)
	at nl.siegmann.epublib.epub.EpubWriter.write(EpubWriter.java:51)
	at org.lazyboy.work.document.EPubUtil.createNewFile(EPubUtil.java:124)
	at org.lazyboy.work.document.EPubUtil.main(EPubUtil.java:144)
Caused by: java.lang.ClassNotFoundException: org.xmlpull.v1.XmlPullParserFactory
	at java.net.URLClassLoader$1.run(URLClassLoader.java:202)
	at java.security.AccessController.doPrivileged(Native Method)
	at java.net.URLClassLoader.findClass(URLClassLoader.java:190)
	at java.lang.ClassLoader.loadClass(ClassLoader.java:307)
	at sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:301)
	at java.lang.ClassLoader.loadClass(ClassLoader.java:248)
	... 8 more
 

 

根据提示:org.xmlpull.v1.XmlPullParserFactory类没有找到,那么就去找合适的jar吧·····你会发现有很多jar里包含了这个类,但是如果不巧你添加了jar包之后,虽然没有了这个异常,但是你会遇到另一个空指针的异常,如下所示:

 

 

Exception in thread "main" java.lang.NullPointerException
	at org.xmlpull.mxp1_serializer.MXSerializer.startDocument(MXSerializer.java:379)
	at nl.siegmann.epublib.epub.PackageDocumentWriter.write(PackageDocumentWriter.java:38)
	at nl.siegmann.epublib.epub.EpubWriter.writePackageDocument(EpubWriter.java:112)
	at nl.siegmann.epublib.epub.EpubWriter.write(EpubWriter.java:53)
	at org.lazyboy.work.document.EPubUtil.createNewFile(EPubUtil.java:124)
	at org.lazyboy.work.document.EPubUtil.main(EPubUtil.java:144)
 

 

那就是你加错jar包了,经过多次试验后,发现应该加入一个kxml2的jar包,其maven坐标如下:

 

 

	<dependency>
		<groupId>kxml2</groupId>
		<artifactId>kxml2</artifactId>
		<version>2.2.2</version>
	</dependency>

 

 本人需要做的操作是:读取一个epub文件,取出需要的chapter,生成一个新的epub文件,或者根据比例对源epub文件进行裁剪;在此过程中遇到了问题,在blog上记录一下

 


分享到:
评论
6 楼 JazzyYang 2012-04-05  
JazzyYang 写道
我想弱弱的问下~~我怎么读到章节信息啊??就是如同目录展示的那样的~我找了老半天木有找到api的方法哦

博主,,我已经解决了,谢谢啦
5 楼 JazzyYang 2012-04-05  
我想弱弱的问下~~我怎么读到章节信息啊??就是如同目录展示的那样的~我找了老半天木有找到api的方法哦
4 楼 virtual_function 2012-03-08  
huoyanyanyi10 写道
楼主 <dependency>
<groupId>kxml2</groupId>
<artifactId>kxml2</artifactId>
<version>2.2.2</version>
</dependency>
发在那里
请赐教




这是maven的坐标啊 如果不会用maven的话 就用这个kxml2的jar包就行了····
3 楼 huoyanyanyi10 2012-03-07  
楼主 <dependency>
<groupId>kxml2</groupId>
<artifactId>kxml2</artifactId>
<version>2.2.2</version>
</dependency>
发在那里
请赐教
2 楼 virtual_function 2012-02-07  
yur630 写道
楼主 , 同在研究 Epublib ,我读到了章节信息,但是怎么读到章节内容啊,求赐教!!!



List<TOCReference> list = book.getTableOfContents().getTocReferences();
   for (TOCReference reference : list) {
      System.out.println(new String(reference.getResource().getData()));
   }


你试试吧
1 楼 yur630 2012-01-16  
楼主 , 同在研究 Epublib ,我读到了章节信息,但是怎么读到章节内容啊,求赐教!!!

相关推荐

    EPUB 解析 (java)

    FBreader是一个知名的开源电子书阅读器项目,其源码中包含了对EPUB文件的支持。在本项目中,我们讨论的是从FBreader项目中优化出的EPUB解析模块。 EPUB格式基于XML和ZIP,它允许电子书内容以结构化的方式组织,包括...

    Java的EPUB类库 Epublib

    2. **读取EPUB书籍**:EpubReader类提供了方法来解析EPUB文件,提取书籍的元数据和内容。它可以访问书籍的目录、章节、图片等,并允许程序对这些内容进行操作或展示。 3. **修改EPUB书籍**:EpubBook类是Epublib的...

    Java的EPUB类库 Epublib源码

    1. **Metadata管理**:Epublib提供了一套接口和类来处理元数据,包括作者、标题、出版日期等信息,这些都是EPUB文件的重要组成部分。通过这些API,开发者可以方便地添加、编辑和读取元数据。 2. **内容模型**:EPUB...

    epub java实现(附带源程序、jar包和epub电子书)

    EpubLib是一个强大的Java库,用于创建、解析和修改EPUB文件。它提供了一系列API,可以方便地添加或删除章节、元数据、图片等。通过阅读提供的源代码,我们可以学习如何使用这个库来实现以下功能: 1. **创建EPUB...

    epublib解析

    epublib的解析流程分析,解读著名的开源epub文件解析库

    最新epub转换器 最新epub转换器

    通过使用Epublib,开发者可以轻松解析Epub文件的内容,然后将其导出到其他格式。 Epublib的主要特性包括: 1. **解析Epub**:Epublib能读取Epub文件的元数据、内容文件和目录结构。 2. **创建Epub**:开发者可以...

    基于Java的的EPUB类库 Epublib.zip

    1. **解析器**:Epublib包含了用于解析EPUB文件的组件,能够解压并解析OPF和NCX文件,提取出元数据、章节信息等内容。 2. **编写器**:该类库还提供了创建新的EPUB文件或修改现有文件的功能。开发者可以通过编写器...

    Java的EPUB类库 Epublib.7z

    1. **EPUB文件解析**:Epublib提供了API来解析EPUB文件的元数据,如书名、作者、出版日期等,并能提取出书籍的目录结构和内容文件。它支持解码EPUB的OPF(OPF打包文件)和NCX(导航内容表)文件,这是EPUB文件中定义...

    epub 所需的三个jar包

    为了在Java环境中解析EPUB文件,我们需要引入一些必要的jar包。本篇文章将详细讲解EPUB格式、Java解析EPUB所需的库以及如何使用这些库。 首先,EPUB格式基于XML,包含了HTML、CSS、图像和其他资源。它使用OPF(Open...

    基于java的的EPUB类库 Epublib.zip

    2. **EPUB文件读取**:类库还支持读取现有的EPUB文件,解析其内容并提供访问元数据、目录和各个章节的方法。这使得开发者可以实现EPUB电子书的浏览和搜索功能。 3. **资源处理**:Epublib可以处理EPUB文件内的各种...

    基于Java的源码-EPUB类库 Epublib.zip

    - **读取EPUB**:解析EPUB文件,提取其中的元数据、内容文件和资源。 - **更新EPUB**:修改已有的EPUB文件,例如更改元数据、替换内容或添加新章节。 - **验证EPUB**:检查EPUB文件是否符合标准,确保其可读性和...

    java源码:Java的EPUB类库 Epublib.zip

    2. **读取EPUB文件**:Epublib提供了`EpubReader`类,用于解析已有的EPUB文件。这包括提取元数据、获取书籍结构以及访问文本和图像资源。通过这个类,开发者可以方便地在程序中处理EPUB书籍内容。 3. **修改EPUB...

    基于Java的实例源码-的EPUB类库 Epublib.zip

    Epublib库使得开发人员能够轻松地创建、读取和修改EPUB文件,从而在Java平台上实现电子书的编译和解析功能。下面将详细探讨Epublib库的核心功能、使用方法以及与Java编程相关的知识点。 1. **EPUB文件结构**:EPUB...

    Python-EbookLib用于管理EPUB2EPUB3和Kindle文件的Python库

    2. **读取EPUB书籍**:库可以解析现有的EPUB文件,提取其中的元数据、内容文件和布局信息。这对于分析或转换电子书非常有用。 3. **编辑EPUB内容**:EbookLib允许你修改已存在的EPUB书籍。你可以更新元数据、替换...

    epublib_jars

    在EPUBlib中,KXML2用于解析EPUB文件中的OPF(Open Package Format)和NCX(Navigation Content eXtension)文件,这些都是EPUB标准中定义的结构文件,包含了书籍的元数据和导航信息。KXML2的高效性能和低内存占用使...

    轻松制作EPUB

    这些工具可能包括Epublib、Calibre、Sigil等,它们可以帮助用户更轻松地创建和编辑EPUB文件。 至于“IBM之蓝色基因.epub”这个文件,它很可能是一个示例电子书,可能是关于IBM的蓝色基因系列超级计算机的介绍。这个...

    pageturner-reader完整源码

    - `EpubParser`: 使用`epublib-core`解析EPUB文件的元数据和内容。 - `Renderer`: 处理页面渲染,确保在不同设备上显示正确。 ### 3. 解析EPUB文件 在PageTurner中,`EpubParser`类是与`epublib-core`交互的关键。...

    Android应用源码电子书阅读器源码.zip

    源码中可能包含解析这些文件的类,例如使用Apache的POI库解析PDF,或者使用第三方库如Epublib解析EPUB文件。 四、数据存储与同步 应用可能支持本地书籍存储和在线书库同步。源码中可能有SQLite数据库的使用,用于...

    claria_psiegman_epublib

    1. **Epub解析**:解析Epub文件的OPF(Open Package Format)和NCX(Navigation Control File),获取书籍的元数据,如标题、作者、出版日期等。 2. **内容提取**:提取Epub中的HTML章节和图像资源,便于展示在阅读...

    Android EBook Reader Source Code

    - EPUB解析:EPUB是一种开放标准的电子书格式,源码可能使用了如Apache POI或Epublib库来解析EPUB文件内容。 - PDF解析:可能使用PDFBox、MuPDF等库实现PDF阅读功能。 - 其他格式:如MOBI、AZW3等,可能需要特定...

Global site tag (gtag.js) - Google Analytics