`
xinlanzero
  • 浏览: 253084 次
  • 性别: Icon_minigender_1
  • 来自: 成都
社区版块
存档分类
最新评论

EPUB文档格式简单总结

阅读更多

epub是一种电子图书标准(文件后缀名为.epub)。

 

epub是一个自由的开放标准,文件本质上就是xhtml经过zip归档压缩所得,在文档中采用几个xml来标示文件的结构。

 

epub 的文件内部结构如下图所示:

 

--ZIP Container--
mimetype
META-INF/
  container.xml
OPS/
  book.opf
  chapter1.xhtml
  ch1-pic.png
  css/
    style.css
    myfont.otf

 

几个重要的xml文件:

 

META-INF/ container.xml:

 

<?xml version="1.0" encoding="UTF-8" ?>
<container version="1.0" xmlns="urn:oasis:names:tc:opendocument:xmlns:container">
<rootfiles>
<rootfile full-path="OPS/fb.opf" media-type="application/oebps-package+xml"/>
</rootfiles>
</container>
<?xml version="1.0" encoding="UTF-8" ?> <container version="1.0" xmlns="urn:oasis:names:tc:opendocument:xmlns:container"> <rootfiles> <rootfile full-path="OPS/fb.opf" media-type="application/oebps-package+xml"/> </rootfiles> </container>

 

在此xml中rootfile节点的full-path属性的值为下一个重要xml文件fb.opf的路径

 

fb.opf:

 

<?xml version="1.0" encoding="UTF-8" ?>
<package version="2.0" unique-identifier="PrimaryID" mlns="http://www.idpf.org/2007/opf">
<metadata xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:opf="http://www.idpf.org/2007/opf">
<dc:title>福尔摩斯探案全集</dc:title>
<dc:identifier opf:scheme="ISBN"></dc:identifier>
<dc:language>简体中文</dc:language>
<dc:creator>柯南道尔</dc:creator>
<dc:publisher>epub掌上书苑</dc:publisher>
<dc:description>《福尔摩斯探案全集》可谓是开辟了侦探小说历史“黄金时代”的不朽经典,一百多年来被译成57种文字,风靡全世界,是历史上最受读者推崇,绝对不能错过的侦探小说。《福尔摩斯探案全集》结构严谨,环环紧扣,故事情节惊险离奇,引人入胜,被推理迷们称为推理小说中的《圣经》,是每一个推理迷必备的案头书籍。从《血字的研究》诞生到现在的一百多年间,福尔摩斯打遍天下无敌手,影响力早已越过推理一隅,成为人们心中神探的代名词。福尔摩斯仿佛真的成为了生活在我们身边的有血有肉的活人,许多人都在寻找福尔摩斯,并坚信确实有这样一位伟大侦探存在。即便是没有看过侦探小说的人,也知道福尔摩斯这号人物!</dc:description>
<dc:coverage></dc:coverage>
<dc:source>http://www.cnepub.com</dc:source>
<dc:date>2010-05-12</dc:date>
<dc:rights>本电子书由epubBuilder制作生成,欢迎访问http://www.cnepub.com浏览海量电子书。</dc:rights>
<dc:subject>侦探·悬疑</dc:subject>
<dc:contributor></dc:contributor>
<dc:type>[type]</dc:type>
<dc:format></dc:format>
<dc:relation></dc:relation>
<dc:builder>epubBuilder</dc:builder>
<dc:builder_version>2.5.4.30</dc:builder_version>
<meta name="cover" content="cover-image"/>
</metadata>
<manifest>
<!-- Content Documents -->
<item id="main-css" href="css/main.css" media-type="text/css"/>
<item id="coverpage"  href="coverpage.html"  media-type="application/xhtml+xml"/>
<item id="chapter1"  href="chapter1.html"  media-type="application/xhtml+xml"/>
.......
<item id="chapter9"  href="chapter9.html"  media-type="application/xhtml+xml"/>

<item id="ncx"  href="fb.ncx" media-type="application/x-dtbncx+xml"/>
<item id="css" href="css/main.css" media-type="text/css"/>
<item id="cover-image" href="images/cover.jpg" media-type="image/jpeg"/>
</manifest>
<spine toc="ncx">
<itemref idref="coverpage" linear="yes"/>
<itemref idref="chapter1" linear="yes"/>
......
<itemref idref="chapter9" linear="yes"/>

</spine>
<guide>
<reference type="cover" title="封面"  href="coverpage.html"/>
<reference type="text" title="1-血字的研究"  href="chapter1.html"/>
......
<reference type="text" title="9-最后致意"  href="chapter9.html"/>

</guide>
</package>

*.OPF文件的根节点package下有4个子节点:metadata,manifest,spine,guide.

  • metadata:保存文档的一些基本信息。
  • manifest: 指示epub包中所有除自己这个文件与mimetype外的所有文件的位置。
  • spine: 列出xhtml文档的读取顺序。
  • guide:列出epub文件的大体结构,其中的reference节点的href属性值在manifest中都存在。
  • 在manifest中我们可以发现一个*.ncx文件,他没啥子内容,wiki上描述他的标准时为有声电子书定制的。
本文内容大多来源于 http://en.wikipedia.org/wiki/EPUB#File_format,该文全当对他的简单总结。
ps:在ibm上看到一篇老外写的epub格式的介绍,还不错就是翻译差了点http://www.ibm.com/developerworks/cn/xml/tutorials/x-epubtut/section3.html
分享到:
评论

相关推荐

    EPub SDK开发文档

    EPub SDK开发文档的知识点主要包括了ThinkEpub阅读SDK在iOS平台的使用说明。ThinkEpub是一个针对数字阅读领域的开发工具包,旨在帮助开发者快速实现功能丰富的电子书阅读应用。以下将详细介绍SDK的使用方法、文件...

    ePub的排版和样式

    下面是 ePub 排版和样式的知识点总结: 一、 ePub 格式电子书 ePub 是一种电子书的载体,而不是一种麻烦的文本保存格式。它是建立在 html 与 css 等等的规范上的一种 eBook 规范。它的本质就是将文本、图片、样式...

    ePub Reader for Windows.zip

    这款软件提供了简单快捷的转换选项,只需几步操作,就能将Epub电子书转换为所需的格式,极大地扩展了电子书的使用范围。 最后,对于那些喜欢批处理操作的用户,Epub Reader for Windows也提供了批量转换的功能。...

    JAVA生成EPUB电子书详解文档.docx

    早期尝试使用了`epub-tools`库中的`epubgen-0.5.0.jar`和`epubcheck-3.0b3.jar`等工具来生成EPUB电子书,这些工具通过创建EPUB文档的方式来实现电子书的生成。然而,对于较为复杂的电子书而言,这种方法可能会遇到...

    最好的epub阅览器eReader

    2. **文本编辑**:与其他简单的阅读应用不同,eReader具备文本编辑功能,用户可以直接在阅读器中对EPUB文件进行编辑,如修改文本、添加注释或高亮重点内容,极大地提升了阅读的互动性。 3. **TXT导出**:对于那些...

    epub-0.3.js javascript实现

    总结来说,epub.js是一个用于Web端EPUB阅读的JavaScript库,0.3版本提供了一套稳定的API来处理EPUB文件。通过与jQuery的结合,开发者可以更轻松地在项目中集成EPUB阅读功能,而无需处理复杂的前端框架集成问题。提供...

    main-VersionV2.04.zip

    总结来说,Main-Version V2.04是一款针对EPUB文件的专业统计工具,其主要功能涵盖了字数、图片和样式三大方面,极大地提升了EPUB内容管理的效率。无论是个人作者还是专业团队,都能从中受益,更高效地管理和优化自己...

    电子书EXE,CHM等格式转换成TXT.exe

    接下来是CHM格式,它是微软的 Compiled HTML Help 文件格式,常用于技术文档和电子手册。CHM文件内嵌了HTML页面和索引,通过专用的查看器可以浏览。转换工具能够解析CHM文件的结构,提取出HTML文本并转换为TXT,保留...

    pdf格式文件怎样才能转换成mobi格式.docx

    PDF格式的文件是一种广泛使用的文档格式,它支持复杂的布局、图像和字体,但并非所有设备都能完美地显示这种格式,特别是在Kindle这样的电子阅读器上。Mobi格式,特别是为Kindle设计的,能提供更好的阅读体验,尤其...

    pandoc-export-markdown

    Pandoc的`-to-epub`选项可以将Markdown文档转换为EPUB格式,适合制作电子书。在转换过程中,Pandoc会自动处理Markdown的标题结构,生成章节和目录,同时还可以包含图片和其他多媒体资源。 **使用Pandoc导出Markdown...

    BookTyper:这个简单的程序使您可以通过以EPUB格式编写一本书来练习打字

    《BookTyper:使用Kotlin打造EPUB格式电子书打字练习工具》 在数字时代,打字已经成为日常工作中不可或缺的一项技能。为了提高打字效率与准确性,各种打字练习软件层出不穷。其中,名为BookTyper的程序以其独特的...

    富文本文档转化工具pandoc

    总结来说,Pandoc是一款不可或缺的工具,无论你是需要将Markdown笔记整理成漂亮的PDF报告,还是需要在不同格式的文档之间进行转换,它都能提供高效、灵活且可定制的解决方案。通过熟练掌握Pandoc,你可以在处理各种...

    万能电子书阅读器,支持chm合成txt文档,支持chm,ebook,mbook,txt,pdb,pdg,pdf等多种格式阅读,读书看教程必备

    1. CHM合成TXT:将复杂的CHM文件转换为简单的TXT格式,方便用户进行文字处理和检索,尤其适合学习和技术研究。 2. 多格式支持:覆盖广泛的电子书格式,满足不同用户的需求,无论书籍来自何处,都能轻松阅读。 3. ...

    TXT转换BIN文件

    这种文件格式简单且通用,可以被大多数文本编辑器打开和编辑。TXT文件基于ASCII或Unicode编码,如UTF-8,确保全球不同语言的字符都能正确表示。 相反,BIN文件是二进制文件,它包含了计算机可以直接执行的原始比特...

    如何把PDF格式文件转换成PPT

    首先,迅捷PDF转换器是一款专业的文件格式转换工具,它针对PDF转换提供了多种功能,包括转换成Word、Excel、图片、HTML、TXT和EPUB等。尤其在转换为PPT时,它展现了极高的识别率和保真度,避免了常见的转换问题,如...

    PDF文档制作转换

    PDF(Portable Document Format)文档是Adobe Systems公司开发的一种文件格式,旨在方便信息交换,它能够保持文档的原始格式,无论在何种设备或操作系统上打开,都能保持一致的显示效果。这款名为“PDF文档制作转换...

    基于Java的实例源码-数字图书制作工具 EpubCheck.zip

    EpubCheck是一个强大的工具,主要用于验证EPUB格式的电子书是否符合开放的EPUB标准。这个工具基于Java,因此可以在多种操作系统上运行,包括Windows、Linux和Mac OS。本实例源码提供了深入理解EPUB规范和Java编程...

    多用途文件转换工具.OmniFormat

    2. **新增格式支持**:增加了对一些新兴格式的支持,如EPUB电子书格式,以适应数字阅读的趋势。 3. **增强的安全性**:集成的Keymaker-CORE组件提供了更安全的激活方式,确保用户数据的安全。 4. **改进的错误修复...

    电子书制作工具

    总结起来,制作电子书涉及多个步骤,从txt文件的管理到epub格式的生成,再到文本编辑工具的运用,每一步都至关重要。通过掌握这些工具和技术,我们可以更加高效地创建高质量的电子书,满足不同场景下的阅读需求。...

    simplepub.py:从文本(.txt)和图像(.png,.jpg,.webp)生成EPUB的工具

    这个工具特别适合那些不熟悉复杂电子书制作流程的用户,只需几步简单的操作,就能生成具有完整结构的EPUB文件。 三、使用步骤 1. 准备素材:确保你有文本文件(如章节.txt)和相应的图像文件(如章节.png)。 2. ...

Global site tag (gtag.js) - Google Analytics