epub是一种电子图书标准(文件后缀名为.epub)。
epub是一个自由的开放标准,文件本质上就是xhtml经过zip归档压缩所得,在文档中采用几个xml来标示文件的结构。
epub 的文件内部结构如下图所示:
--ZIP Container--
mimetype
META-INF/
container.xml
OPS/
book.opf
chapter1.xhtml
ch1-pic.png
css/
style.css
myfont.otf
几个重要的xml文件:
META-INF/ container.xml:
<?xml version="1.0" encoding="UTF-8" ?>
<container version="1.0" xmlns="urn:oasis:names:tc:opendocument:xmlns:container">
<rootfiles>
<rootfile full-path="OPS/fb.opf" media-type="application/oebps-package+xml"/>
</rootfiles>
</container>
<?xml version="1.0" encoding="UTF-8" ?>
<container version="1.0" xmlns="urn:oasis:names:tc:opendocument:xmlns:container">
<rootfiles>
<rootfile full-path="OPS/fb.opf" media-type="application/oebps-package+xml"/>
</rootfiles>
</container>
在此xml中rootfile节点的full-path属性的值为下一个重要xml文件fb.opf的路径
fb.opf:
<?xml version="1.0" encoding="UTF-8" ?>
<package version="2.0" unique-identifier="PrimaryID" mlns="http://www.idpf.org/2007/opf">
<metadata xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:opf="http://www.idpf.org/2007/opf">
<dc:title>福尔摩斯探案全集</dc:title>
<dc:identifier opf:scheme="ISBN"></dc:identifier>
<dc:language>简体中文</dc:language>
<dc:creator>柯南道尔</dc:creator>
<dc:publisher>epub掌上书苑</dc:publisher>
<dc:description>《福尔摩斯探案全集》可谓是开辟了侦探小说历史“黄金时代”的不朽经典,一百多年来被译成57种文字,风靡全世界,是历史上最受读者推崇,绝对不能错过的侦探小说。《福尔摩斯探案全集》结构严谨,环环紧扣,故事情节惊险离奇,引人入胜,被推理迷们称为推理小说中的《圣经》,是每一个推理迷必备的案头书籍。从《血字的研究》诞生到现在的一百多年间,福尔摩斯打遍天下无敌手,影响力早已越过推理一隅,成为人们心中神探的代名词。福尔摩斯仿佛真的成为了生活在我们身边的有血有肉的活人,许多人都在寻找福尔摩斯,并坚信确实有这样一位伟大侦探存在。即便是没有看过侦探小说的人,也知道福尔摩斯这号人物!</dc:description>
<dc:coverage></dc:coverage>
<dc:source>http://www.cnepub.com</dc:source>
<dc:date>2010-05-12</dc:date>
<dc:rights>本电子书由epubBuilder制作生成,欢迎访问http://www.cnepub.com浏览海量电子书。</dc:rights>
<dc:subject>侦探·悬疑</dc:subject>
<dc:contributor></dc:contributor>
<dc:type>[type]</dc:type>
<dc:format></dc:format>
<dc:relation></dc:relation>
<dc:builder>epubBuilder</dc:builder>
<dc:builder_version>2.5.4.30</dc:builder_version>
<meta name="cover" content="cover-image"/>
</metadata>
<manifest>
<!-- Content Documents -->
<item id="main-css" href="css/main.css" media-type="text/css"/>
<item id="coverpage" href="coverpage.html" media-type="application/xhtml+xml"/>
<item id="chapter1" href="chapter1.html" media-type="application/xhtml+xml"/>
.......
<item id="chapter9" href="chapter9.html" media-type="application/xhtml+xml"/>
<item id="ncx" href="fb.ncx" media-type="application/x-dtbncx+xml"/>
<item id="css" href="css/main.css" media-type="text/css"/>
<item id="cover-image" href="images/cover.jpg" media-type="image/jpeg"/>
</manifest>
<spine toc="ncx">
<itemref idref="coverpage" linear="yes"/>
<itemref idref="chapter1" linear="yes"/>
......
<itemref idref="chapter9" linear="yes"/>
</spine>
<guide>
<reference type="cover" title="封面" href="coverpage.html"/>
<reference type="text" title="1-血字的研究" href="chapter1.html"/>
......
<reference type="text" title="9-最后致意" href="chapter9.html"/>
</guide>
</package>
*.OPF文件的根节点package下有4个子节点:metadata,manifest,spine,guide.
-
metadata:保存文档的一些基本信息。
-
manifest: 指示epub包中所有除自己这个文件与mimetype外的所有文件的位置。
-
spine: 列出xhtml文档的读取顺序。
-
guide:列出epub文件的大体结构,其中的reference节点的href属性值在manifest中都存在。
-
在manifest中我们可以发现一个*.ncx文件,他没啥子内容,wiki上描述他的标准时为有声电子书定制的。
分享到:
相关推荐
EPub SDK开发文档的知识点主要包括了ThinkEpub阅读SDK在iOS平台的使用说明。ThinkEpub是一个针对数字阅读领域的开发工具包,旨在帮助开发者快速实现功能丰富的电子书阅读应用。以下将详细介绍SDK的使用方法、文件...
下面是 ePub 排版和样式的知识点总结: 一、 ePub 格式电子书 ePub 是一种电子书的载体,而不是一种麻烦的文本保存格式。它是建立在 html 与 css 等等的规范上的一种 eBook 规范。它的本质就是将文本、图片、样式...
这款软件提供了简单快捷的转换选项,只需几步操作,就能将Epub电子书转换为所需的格式,极大地扩展了电子书的使用范围。 最后,对于那些喜欢批处理操作的用户,Epub Reader for Windows也提供了批量转换的功能。...
早期尝试使用了`epub-tools`库中的`epubgen-0.5.0.jar`和`epubcheck-3.0b3.jar`等工具来生成EPUB电子书,这些工具通过创建EPUB文档的方式来实现电子书的生成。然而,对于较为复杂的电子书而言,这种方法可能会遇到...
2. **文本编辑**:与其他简单的阅读应用不同,eReader具备文本编辑功能,用户可以直接在阅读器中对EPUB文件进行编辑,如修改文本、添加注释或高亮重点内容,极大地提升了阅读的互动性。 3. **TXT导出**:对于那些...
总结来说,epub.js是一个用于Web端EPUB阅读的JavaScript库,0.3版本提供了一套稳定的API来处理EPUB文件。通过与jQuery的结合,开发者可以更轻松地在项目中集成EPUB阅读功能,而无需处理复杂的前端框架集成问题。提供...
总结来说,Main-Version V2.04是一款针对EPUB文件的专业统计工具,其主要功能涵盖了字数、图片和样式三大方面,极大地提升了EPUB内容管理的效率。无论是个人作者还是专业团队,都能从中受益,更高效地管理和优化自己...
接下来是CHM格式,它是微软的 Compiled HTML Help 文件格式,常用于技术文档和电子手册。CHM文件内嵌了HTML页面和索引,通过专用的查看器可以浏览。转换工具能够解析CHM文件的结构,提取出HTML文本并转换为TXT,保留...
PDF格式的文件是一种广泛使用的文档格式,它支持复杂的布局、图像和字体,但并非所有设备都能完美地显示这种格式,特别是在Kindle这样的电子阅读器上。Mobi格式,特别是为Kindle设计的,能提供更好的阅读体验,尤其...
Pandoc的`-to-epub`选项可以将Markdown文档转换为EPUB格式,适合制作电子书。在转换过程中,Pandoc会自动处理Markdown的标题结构,生成章节和目录,同时还可以包含图片和其他多媒体资源。 **使用Pandoc导出Markdown...
《BookTyper:使用Kotlin打造EPUB格式电子书打字练习工具》 在数字时代,打字已经成为日常工作中不可或缺的一项技能。为了提高打字效率与准确性,各种打字练习软件层出不穷。其中,名为BookTyper的程序以其独特的...
总结来说,Pandoc是一款不可或缺的工具,无论你是需要将Markdown笔记整理成漂亮的PDF报告,还是需要在不同格式的文档之间进行转换,它都能提供高效、灵活且可定制的解决方案。通过熟练掌握Pandoc,你可以在处理各种...
1. CHM合成TXT:将复杂的CHM文件转换为简单的TXT格式,方便用户进行文字处理和检索,尤其适合学习和技术研究。 2. 多格式支持:覆盖广泛的电子书格式,满足不同用户的需求,无论书籍来自何处,都能轻松阅读。 3. ...
这种文件格式简单且通用,可以被大多数文本编辑器打开和编辑。TXT文件基于ASCII或Unicode编码,如UTF-8,确保全球不同语言的字符都能正确表示。 相反,BIN文件是二进制文件,它包含了计算机可以直接执行的原始比特...
首先,迅捷PDF转换器是一款专业的文件格式转换工具,它针对PDF转换提供了多种功能,包括转换成Word、Excel、图片、HTML、TXT和EPUB等。尤其在转换为PPT时,它展现了极高的识别率和保真度,避免了常见的转换问题,如...
PDF(Portable Document Format)文档是Adobe Systems公司开发的一种文件格式,旨在方便信息交换,它能够保持文档的原始格式,无论在何种设备或操作系统上打开,都能保持一致的显示效果。这款名为“PDF文档制作转换...
EpubCheck是一个强大的工具,主要用于验证EPUB格式的电子书是否符合开放的EPUB标准。这个工具基于Java,因此可以在多种操作系统上运行,包括Windows、Linux和Mac OS。本实例源码提供了深入理解EPUB规范和Java编程...
2. **新增格式支持**:增加了对一些新兴格式的支持,如EPUB电子书格式,以适应数字阅读的趋势。 3. **增强的安全性**:集成的Keymaker-CORE组件提供了更安全的激活方式,确保用户数据的安全。 4. **改进的错误修复...
总结起来,制作电子书涉及多个步骤,从txt文件的管理到epub格式的生成,再到文本编辑工具的运用,每一步都至关重要。通过掌握这些工具和技术,我们可以更加高效地创建高质量的电子书,满足不同场景下的阅读需求。...
这个工具特别适合那些不熟悉复杂电子书制作流程的用户,只需几步简单的操作,就能生成具有完整结构的EPUB文件。 三、使用步骤 1. 准备素材:确保你有文本文件(如章节.txt)和相应的图像文件(如章节.png)。 2. ...