`
isiqi
  • 浏览: 16499971 次
  • 性别: Icon_minigender_1
  • 来自: 济南
社区版块
存档分类
最新评论

epub格式电子书剖析之一:文档构成

阅读更多

epub格式电子书遵循IDPF推出的OCF规范,OCF规范遵循ZIP压缩技术,即epub电子书本身就是一个ZIP文件,我们将epub格式电 子书的后缀.epub修改为.zip后,可以通过解压缩软件(例如winrar、winzip)进行浏览或解压处理。一个未经加密处理的epub电子书以 三个部分组成,其文件结构如下图所示:

1、文件:mimetype

每一本epub电子书均包含一个名为mimetype的文件,且内容不变,用以说明epub的文件格式。文件内容如下:

application/epub+zip //注释,表示可以用epub工具和ZIP工具打开

2、目录:META-INF

依据OCF规范,META-INF用于存放容器信息,默认情况下(即加密处理),该目录包含一个文件,即container.xml,文件内容如下:

<?xml version='1.0' encoding='utf-8'?>
<container xmlns="urn:oasis:names:tc:opendocument:xmlns:container" version="1.0">
<rootfiles>
<rootfile full-path="OEBPS/content.opf" media-type="application/oebps-package+xml" />
</rootfiles>
</container>

container.xml的主要功能用于告诉阅读器,电子书的根文件(rootfile)的路径(红色部分)和打开放式,一般来讲,该container.xml文件也不需要作任何修改,除非你改变了根文件的路径和文件名称。

除container.xml文件之外,OCF还规定了以下几个文件:

(1)[manifest.xml],文件列表
(2) [metadata.xml],元数据
(3) [signatures.xml],数字签名
(4) [encryption.xml],加密
(5) [rights.xml],权限管理
对于epub电子书而言,这些文件都是可选的。

3、目录:OEBPS

OEBPS目录用于存放OPS文档、OPF文档、CSS文档、NCX文档,如果是制作中文电子书,则还包括ttf文档(即字体文档),OEBPS目录也可 以建立相应的子目录,例如建立chapter目录,把各章节的OPS文档放在chapter目录之中。下图一本epub电子书OEBPS文档的实例图:

其中content.opf文件和toc.ncx文件为必需,其它文件可根据电子书的具体情况而定。

content.opf文件见博文OPF剖析

toc.ncx文件见博文toc.ncx剖析

分享到:
评论

相关推荐

    epub格式电子书剖析之一:文档构成.pdf

    3. **OEBPS目录**:这是epub电子书的核心内容所在,包含了OPS(Open Publication Structure)文档、OPF(Open Packaging Format)文档、CSS(Cascading Style Sheets)文档、NCX(Navigation Control File for XML)...

    epub文档 转 txt文档 源码

    在IT领域,文件格式转换是一项常见的任务,尤其对于电子书爱好者和数字图书馆管理员而言。本话题涉及的是将EPUB格式的电子书转换...而对于普通用户,使用这样的转换工具则能方便地将EPUB电子书转化为更通用的TXT格式。

    epub格式阅读器源码

    Epub格式阅读器源码是用于解析和展示Epub电子书内容的应用程序代码。Epub是一种开放标准的电子书格式,由国际数字出版论坛(IDPF)制定,它允许书籍内容以结构化的方式进行组织,便于在不同设备上阅读。Epub文件实际...

    TXT转换器 电子书格式转换

    1. EPUB:一种开放标准格式,支持图文混排,适用于多种设备。 2. MOBI:Amazon Kindle设备的主要格式,支持自定义布局和CSS样式。 3. PDF:通用文档格式,保持原版面设计,适合打印。 4. AZW3:Amazon最新一代Kindle...

    EPUB 解析 (java)

    EPUB解析是数字出版领域中的一个重要技术,它涉及到电子书的结构化处理和内容提取。在Java编程语言中,EPUB解析通常通过特定的库或框架来实现,以方便开发者处理这种开放标准的电子书格式。FBreader是一个知名的开源...

    电子书反编译工具大全

    在IT领域,电子书反编译工具是一种特殊的应用程序,它们允许用户解析和提取电子书内容,以便于编辑、分析或转换格式。标题"电子书反编译工具大全"表明这是一个集合,可能包含多种不同类型的反编译工具,旨在帮助用户...

    Python-EbookLib用于管理EPUB2EPUB3和Kindle文件的Python库

    EbookLib是一个强大的Python库,专门用于管理和操作EPUB2、EPUB3以及Kindle格式的电子书。这个库为开发者提供了丰富的功能,使他们能够方便地读取、创建、编辑和转换电子书内容。在Python开发中,尤其是在处理与电子...

    电子书阅读器大全(可读10种常用格式)

    5. **FB2**:一种基于XML的格式,常见于俄罗斯的电子书市场,支持丰富的元数据和样式。 6. **TXT**:纯文本格式,最简单也最通用,任何设备几乎都能打开。 7. **DJVU**:适合存储扫描版的书籍,压缩率高,图像质量...

    epub阅读,工作期间休闲必备(java程序员)

    EpubReader是一个专门针对epub格式电子书的阅读工具,它可能是一个Java开发的软件或库,使得程序员能够在工作中轻松地阅读技术文档、编程书籍或其他感兴趣的读物。 Epub是一种开放标准的电子书格式,全称为...

    EXE电子书转TXT文本文档

    在本例中,我们关注的是“EXE电子书转TXT文本文档”的主题,这涉及到从.exe(可执行文件)格式的电子书中提取内容并将其转换成.txt(纯文本文件)格式。下面我们将详细探讨这一过程、相关的技术以及可能的实现方法。...

    EPUB3.0内容文件规范中文版

    ### EPUB3.0内容文件规范中文版知识点详解 #### 一、术语、定义和缩略语 ...EPUB3.0不仅利用了HTML5的强大功能,还针对电子书的特点进行了定制和优化,从而使得EPUB格式成为当前最流行的电子书格式之一。

    OpenCV 中文文档.epub

    《OpenCV 中文文档》是一本详细介绍OpenCV(Open Source Computer Vision Library)的电子书,以EPUB格式呈现。OpenCV是一个开源的计算机视觉和机器学习软件库,它包含了众多的函数和算法,用于处理图像和视频数据。...

    使用 EPUB 制作数字图书

    - **DocBook XML**:一种用于技术文档的标准格式。 - **XSLT**:用于XML文档转换的语言。 #### 八、自动化创建EPUB - **使用Python**:编写Python脚本来自动化整个过程,包括转换、打包和验证。 - **API和库**:...

    re0_1-17epub.7z

    在你提供的压缩包文件"re0_1-17epub.7z"中,我们可以推测这包含了《re0》系列前17集的电子书资源,可能是小说或漫画形式,格式为EPUB,这是一种常见的电子书格式,支持文字、图片甚至音频的多媒体展示。 EPUB文件的...

    PyPI 官网下载 | cnx-epub-0.10.0.zip

    "cnx-epub"库是专为处理EPUB电子书格式而设计的工具,EPUB是一种开放标准的电子书格式,广泛应用于数字阅读器和电子图书出版。这个库的出现,旨在帮助开发者更方便地创建、修改或分析EPUB文件,从而提升Python在数字...

    基于Android平台的手机电子书阅读器设计实用文档doc.doc

    用户通常期望阅读器具备快速加载书籍、良好的阅读体验(如字体大小调整、夜间模式切换)、书籍管理功能(如分类、搜索、下载)以及支持多种格式的电子书(如EPUB、PDF、MOBI等)。此外,考虑到移动设备的特点,阅读...

    jar电子书生成器/jar电子书生成器

    【标题解析】:“jar电子书生成器”是指一个软件工具,它的主要功能是将文本、图像、音频等多媒体内容打包成JAR格式的电子书,这种格式通常用于早期的移动设备,如Java支持的手机,方便用户在这些设备上阅读。...

    Wpf电子书阅读器

    1. **文件格式支持**:常见的电子书格式有EPUB、PDF、MOBI等,阅读器需要能够解析这些格式,并正确显示内容。 2. **页面翻页效果**:模拟真实的书籍翻页效果,增加阅读体验。 3. **阅读设置**:字体大小调整、背景...

Global site tag (gtag.js) - Google Analytics