`
isiqi
  • 浏览: 16499860 次
  • 性别: Icon_minigender_1
  • 来自: 济南
社区版块
存档分类
最新评论

epub格式电子书剖析之二:OPF文件构成

阅读更多

OPF文档是epub电子书的核心文件,且是一个标准的XML文件,依据OPF规范,主要由五个部分组成:

1、<metadata>,元数据信息,由两个子元素组成:

  • <dc-metadata>,其元素构成采用dubline core(DC)的15项核心元素,包括:
    • <title>:题名
    • <creator>:责任者
    • <subject>:主题词或关键词
    • <description>:内容描述
    • <contributor>:贡献者或其它次要责任者
    • <date>:日期
    • <type>:类型
    • <format>:格式
    • <identifier>:标识符
    • <source>:来源
    • <language>:语种
    • <relation>:相关信息
    • <coverage>:履盖范围
    • <rights>:权限描述
  • <x-metadata>,即扩展元素。如果有些信息在上述元素中无法描述,则在此元素中进行扩展。

2、<menifest>,文件列表,由于列出OEBPS文档及相关的文档,有一个子元素构成,

  • <item id="" href="" media-type="">,该元素由三个属性构成:
    • id:表示文件的ID号
    • href:文件的相对路径
    • media-type:文件的媒体类型
    • 例如:<item id="chap01" href="chap01.xhtml" media-type="application/xhtml+xml"/>

3、<spine toc="ncx">,脊骨,其主要功能是提供书籍的线性阅读次序。由一个子元素构成:

  • <itemref idref="">,由一个属性构成:
    • idref:即参照menifest列出的ID
    • 例如:<itemref idref="chap01"/>

4、<guide>,指南,依次列出电子书的特定页面, 例如封面、目录、序言等, 属性值指向文件保存地址。一般情况下,epub电子书可以不用该元素。

5、<tour>,导读。可以根据不同的读者水平或者阅读目的, 按一定次序, 选择电子书中的部分页面组成导读。一般情况下,epub电子书可以不用该元素。

content.opf实例:

<?xml version="1.0" encoding="utf-8"?>
<!DOCTYPE package PUBLIC "+//ISBN 978-7-308-05831-5//DTD OEB 1.2 Package//EN" "http://openebook.org/dtds/oeb-1.2/oebpkg12.dtd ">
<package unique-identifier="bookid" xmlns:opf="http://www.idpf.org/2007/opf " xmlns="http://www.idpf.org/2007/opf " version="2.0">
<metadata>
<dc-metadata xmlns:dc="http://purl.org/dc/elements/1.1/ " xmlns:dcterms="http://purl.org/dc/terms/ " xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance ">
<dc:title>数字档案馆理论与技术研究</dc:title>
<dc:creator>金更达</dc:creator>
<dc:subject>数字档案馆</dc:subject>
<dc:subject>电子文件管理</dc:subject>
<dc:subject>元数据</dc:subject>
<dc:subject>数字化</dc:subject>
<dc:subject>档案化</dc:subject>
<dc:description>当……<dc:description>
<dc:publisher>机械工业出版社</dc:publisher>
<dc:contributor/>
<dc:date>2007-09</dc:date>
<dc:type>普通图书</dc:type>
<dc:format>Text/html(.html,.htm)</dc:format>
<dc:identifier id="bookid" opf:scheme="ISBN">isbn:978-7-111-04961-6</dc:identifier>
<dc:source/>
<dc:language>chi</dc:language>
<dc:relation/>
<dc:coverage/>
<dc:rights>机械工业出版社版权所有</dc:rights>
</dc-metadata>
<x-metadata/>
</metadata>
<manifest>
<item id="ncx" href="toc.ncx" media-type="application/x-dtbncx+xml"/>
<item id="style" href="style.css" media-type="text/css"/>
<item id="cover" href="cover.htm" media-type="text/html"/>
<item id="tableofc" href="toc.xhtml" media-type="application/xhtml+xml"/>
<item id="forword" href="forword.xhtml" media-type="application/xhtml+xml"/>
<item id="chap01" href="chap01.xhtml" media-type="application/xhtml+xml"/>
<item id="chap02" href="chap02.xhtml" media-type="application/xhtml+xml"/>
<item id="chap03" href="chap03.xhtml" media-type="application/xhtml+xml"/>
<item id="chap04" href="chap04.xhtml" media-type="application/xhtml+xml"/>
<item id="chap05" href="chap05.xhtml" media-type="application/xhtml+xml"/>
<item id="chap06" href="chap06.xhtml" media-type="application/xhtml+xml"/>
<item id="chap07" href="chap07.xhtml" media-type="application/xhtml+xml"/>
<item id="chap08" href="chap08.xhtml" media-type="application/xhtml+xml"/>
<item id="chap09" href="chap09.xhtml" media-type="application/xhtml+xml"/>
<item id="chap10" href="chap10.xhtml" media-type="application/xhtml+xml"/>
<item id="reference" href="reference.xhtml" media-type="application/xhtml+xml"/>
</manifest>
<spine toc="ncx">
<itemref idref="cover"/>
<itemref idref="tableofc"/>
<itemref idref="forword"/>
<itemref idref="chap01"/>
<itemref idref="chap02"/>
<itemref idref="chap03"/>
<itemref idref="chap04"/>
<itemref idref="chap05"/>
<itemref idref="chap06"/>
<itemref idref="chap07"/>
<itemref idref="chap08"/>
<itemref idref="chap09"/>
<itemref idref="chap10"/>
<itemref idref="reference"/>
</spine>
<guide/>
</package>
分享到:
评论

相关推荐

    epub格式电子书剖析之一:文档构成.pdf

    **文件构成** 1. **mimetype文件**:每个epub电子书的核心是一个名为mimetype的特殊文件,它不包含在任何目录或压缩包内,而是直接位于ZIP文件的最前端。这个文件的内容固定为“application/epub+zip”,用来标识...

    ePub格式电子书读取ipad源码

    2. **OPF和NCX文件处理**:ePub文件中的OPF(Open Packaging Format)文件是元数据容器,包含了书籍的信息,如标题、作者、出版日期等。NCX(Navigation Control Document in XML)则定义了书籍的导航结构,如章节和...

    解析 Epub格式文件的dameon

    总结起来,Epub Daemon是处理Epub文件的一种高效工具,它能够帮助我们快速理解和操作Epub格式,无论是为了阅读、分析还是二次开发。通过深入理解Epub的结构和解析机制,我们可以更好地利用这个daemon来满足各种需求...

    关于EPUB格式的初步理解

    OPF(Open Packaging Format)文件是EPUB的核心组成部分之一,它使用XML格式定义书籍的结构和内容。OPF文件主要包括以下元素: - **package**:定义了OPF文件的基本属性,如版本号、名称空间等。 - **metadata**:...

    EPUB 解析 (java)

    总的来说,Java EPUB解析模块是电子书应用的核心部分,它使得开发者可以轻松地与EPUB内容交互,创建阅读器应用或进行内容分析。通过从FBreader项目中提取和优化这一模块,我们可以获得一个经过实践验证且高效稳定的...

    epub格式阅读器源码

    Epub格式阅读器源码是一种用于开发电子书阅读应用的软件资源,主要处理Epub文件,这是一种开放标准的电子书格式。源码的详细性意味着它包含完整的代码结构,可以帮助开发者理解阅读器的工作原理,并根据需求进行定制...

    epub格式的深入python.zip

    在Python中处理EPUB文件可以涉及到多个方面,包括读取、解析、编辑以及创建新的EPUB电子书。这篇教程将深入探讨如何使用Python来操作EPUB格式。 首先,Python中用于处理EPUB的库通常是`ebooklib`,这是一个强大的库...

    基于Java的源码-EPUB类库 Epublib.zip

    Epublib库提供了处理这些组件的API,使得开发者能够方便地进行EPUB电子书的生成和解析。 1. **EPUB结构**: - OPF(Open Package Format)文件:这是EPUB的核心,包含元数据(作者、标题、出版日期等)、内容目录...

    dotnet-EpubReader用于读取EPUB文件的NET库

    《.NET库dotnet-EpubReader:轻松读取EPUB电子书》 在数字化阅读盛行的今天,EPUB格式作为开放标准的电子书格式之一,被广泛应用。对于开发者来说,能够方便地在.NET环境中处理EPUB文件是一项重要的技能。本文将...

    wd2epub:wd2epub从html文件集创建epub文件-开源

    5. **验证与压缩**: 最后, wd2epub会使用EPUB验证工具检查生成的EPUB文件是否符合标准,然后进行压缩,形成可分发的EPUB电子书。 使用wd2epub的优势在于其开源性质,这意味着代码对所有人开放,用户可以根据自己...

    txt转epub.zip

    总的来说,"txt转epub.zip"压缩包中的工具为用户提供了便捷的方式,将简单的TXT文本转化为结构化、可定制的EPUB电子书,这对于喜欢阅读和分享电子书的人来说是非常实用的。同时,理解EPUB的基本结构和转换过程也能...

    提取电子书中的文字

    1. 文件解析:程序首先需要识别并解析电子书的文件格式,理解其内部结构,例如PDF的Object树或EPUB的OPF文件。 2. 内容提取:然后,程序会逐页或逐节读取内容,提取出文字和图像。对于有加密或保护的电子书,可能...

    Android应用源码之FBReader修改epub快速加载.zip

    FBReader是一款开源的电子书阅读器,专注于提供良好的阅读体验,支持多种格式,包括EPUB。本压缩包中的内容主要是对FBReader源码进行修改,以优化EPUB书籍的加载速度。通过对源码的深入理解和修改,我们可以了解到...

    opf_updated

    标题“opf_updated”可能指的是一个关于Open Packaging Format (OPF)更新的项目或资源,这通常与电子书、...在实际项目中,开发者可能需要结合这些知识来创建、修改或分析OPF文件,以实现特定的功能或满足业务需求。

    EpubToTxt转换工具

    EpubToTxt转换工具是一款专为电子书爱好者设计的应用程序,旨在将Epub格式的电子书籍转换成更通用且易于阅读的TXT文本格式。Epub是一种开放标准的电子书格式,它采用XML技术,支持多媒体内容和复杂的布局,但在某些...

    应用源码之FBReader修改epub快速加载.zip

    本资源提供的"应用源码之FBReader修改epub快速加载.zip",主要关注的是对FBReader源码进行修改,以提升EPUB电子书的加载速度。这对于那些想要深入理解Android应用开发,特别是对阅读器应用有研究需求的开发者来说,...

Global site tag (gtag.js) - Google Analytics