- 浏览: 595699 次
- 性别:
- 来自: 北京
-
文章分类
最新评论
-
小网客:
噱头 没实际意义
【互动出版网】11.11购物狂欢节重磅大促,免费领万千优惠券 -
tongchuang123:
这是要出书了吗:o
微信控 控微信 -
韶华无限:
这也可以出本书……
玩转微信(彩印) -
zhukewen_java:
无语了。。。哪天出本《玩转QQ》?
玩转微信(彩印) -
yaying:
我只见过MySQL Cookbook中文版
jQuery Cookbook中文版
《高可用性的HDFS—Hadoop分布式文件系统深度实践》
基本信息
作者: 文艾 王磊
出版社:清华大学出版社
ISBN:9787302282587
上架时间:2012-5-14
出版日期:2012 年5月
开本:16开
页码:371
版次:1-1
所属分类: 计算机 > 软件与程序设计 > 分布式系统设计
![]() |
更多详情 》》》高可用性的HDFS—Hadoop分布式文件系统深度实践
内容简介
计算机书籍
《高可用性的hdfs—hadoop分布式文件系统深度实践》专注于hadoop分布式文件系统(hdfs)的主流ha解决方案,内容包括:hdfs元
数据解析、hadoop元数据备份方案、hadoop backup
node方案、avatarnode解决方案以及最新的ha解决方案cloudrea ha name node等。其中有关backup
node方案及avatarnode方案的内容是本书重点,尤其是对avatarnode方案从运行机制到异常处理方案的步骤进行了详尽介绍,同时还总结
了各种异常情况下avatarnode的各种处理方案。
《高可用性的hdfs—hadoop分布式文件系统深度实践》从代码入手并结合情景分析、案例解说对hdfs的元数据以及主流的hdfs ha解决方案的运行机制进行了深入剖析,力求使读者在解决问题时做到心中有数,不仅知其然还知其所以然。
本书光盘包含本书部分操作的视频教程以及所有源代码、脚本等开发文件。
《高可用性的hdfs—hadoop分布式文件系统深度实践》读者主要为云计算相关领域的研发人员、云计算系统管理维护人员,也适合作为高校研究生和高年级本科生的专业课辅助教材。
目录
《高可用性的hdfs—hadoop分布式文件系统深度实践》
第1章 hdfs ha及解决方案 1
1.1 hdfs系统架构 2
1.2 ha定义 3
1.3 hdfs ha原因分析及应对措施 4
1.3.1 可靠性 4
1.3.2 可维护性 5
1.4 现有hdfs ha解决方案 5
1.4.1 hadoop的元数据备份方案 6
1.4.2 hadoop的secondarynamenode方案 7
1.4.3 hadoop的checkpoint ode方案 7
1.4.4 hadoop的backupnode方案 8
1.4.5 drdb方案 9
1.4.6 facebook的avatarnode方案 10
1.5 方案优缺点比较 10
第2章 hdfs元数据解析 13
2.1 概述 14
2.2 内存元数据结构 14
2.2.1 inode 15
2.2.2 block 16
.2.2.3 blockinfo和datanodedescriptor 17
2.2.4 小结 17
2.2.5 代码分析——元数据结构 18
2.3 磁盘元数据文件 24
2.4 format情景分析 27
2.5 元数据应用场景分析 45
第3章 hadoop的元数据备份方案 47
3.1 运行机制分析 48
3.1.1 namenode启动加载元数据情景分析 50
3.1.2 元数据更新及日志写入情景分析 64
3.1.3 checkpoint过程情景分析 73
3.1.4 元数据可靠性机制 109
3.1.5 元数据一致性机制 110
3.2 使用说明 110
第4章 hadoop的backup node方案 113
4.1 backup node概述 114
4.1.1 系统架构 115
4.1.2 使用原则 115
4.1.3 优缺点 116
4.2 运行机制分析 116
4.2.1 启动流程 117
4.2.2 元数据操作情景分析 141
4.2.3 日志池(journal spool)机制 151
4.2.4 故障切换机制 156
4.3 实验方案说明 158
4.4 构建实验环境 158
4.4.1 网络拓扑 159
4.4.2 系统安装及配置 160
4.4.3 安装jdk 170
4.4.4 虚拟机集群架设 171
4.4.5 namenode安装及配置 173
4.4.6 backup node安装及配置 173
4.4.7 data node安装及配置 174
4.4.8 clients安装及配置 175
4.5 异常解决方案 175
4.5.1 异常情况分析 175
4.5.2 namenode配置 175
4.5.3 backup node配置 182
4.5.4 data node配置 185
4.5.5 namenode宕机切换实验 189
4.5.6 namenode宕机读写测试 196
第5章 avatarnode运行机制 205
5.1 方案说明 206
5.1.1 系统架构 206
5.1.2 思路分析 208
5.1.3 性能数据 209
5.2 元数据分析 209
5.2.1 类fsnamesystem 210
5.2.2 类fsdirectory 210
5.2.3 avatarnode的磁盘元数据文件 211
5.3 avatarnode primary启动过程 211
5.4 avatarnode standby启动过程 217
5.4.1 avatarnode的构造方法 217
5.4.2 standby线程的run()方法 218
5.4.3 ingest线程的run()方法 220
5.4.4 ingest线程的ingestfsedits ()方法 220
5.4.5 standby线程的docheckpoint()方法 221
5.5 用户操作情景分析 223
5.5.1 创建目录情景分析 223
5.5.2 创建文件情景分析 231
5.6 avatarnode standby故障切换过程 240
5.7 元数据一致性保证机制 242
5.7.1 元数据目录树信息 242
5.7.2 data node与block数据块映射信息 243
5.8 block更新同步问题 246
5.8.1 问题描述 246
5.8.2 结论 246
5.8.3 源码分析 246
第6章 avatarnode使用 253
6.1 方案说明 254
6.1.1 网络拓扑 254
6.1.2 操作系统安装及配置 255
6.2 使用avatar打补丁版本 255
6.2.1 hadoop源码联机build 256
6.2.2 hadoop源码本地build 262
6.2.3 nfs服务器构建 264
6.2.4 avatar分发与部署 267
6.2.5 primary(namenode0)节点配置 269
6.2.7 data node节点配置 276
6.2.8 client节点配置 278
6.2.9 创建目录 279
6.2.10 挂载nfs 280
6.2.11 启动ucarp 280
6.2.12 格式化 281
6.2.13 系统启动 281
6.2.14 检查 282
6.2.15 namenode失效切换写文件实验 283
6.2.16 namenode失效切换读文件实验 291
6.3 avatar facebook版本的使用 294
6.3.1 hadoop facebook版本安装 294
6.3.2 节点配置 295
6.3.3 启动hdfs 300
6.3.4 namenode失效切换 302
第7章 avatarnode异常解决方案 305
7.1 测试环境 306
7.2 primary失效 306
7.2.1 解决方案 306
7.2.2 写操作实验步骤 307
7.2.3 改进写操作机制 313
7.2.4 读操作实验步骤 313
7.2.5 小结 317
7.3 standby失效 317
7.4 nfs失效(数据未损坏) 317
7.4.1 解决方案 317
7.4.2 写操作实验步骤 318
7.4.3 读操作实验步骤 320
7.4.4 小结 322
7.5 nfs失效(数据已损坏) 323
7.5.1 解决方案 323
7.5.2 写操作实验步骤 324
7.5.3 读操作实验步骤 327
7.5.4 小结 330
7.6 primary先失效,nfs后失效(数据未损坏) 331
7.6.1 解决方案 331
7.6.2 写操作实验步骤 331
7.6.3 读操作实验步骤 333
7.6.4 小结 334
7.7 primary先失效(数据未损坏),nfs后失效(数据损坏) 335
7.7.1 解决方案 335
7.7.2 写操作实验步骤 335
7.7.3 读操作实验步骤 338
7.7.4 小结 339
7.8 nfs先失效(数据未损坏),primary后失效 340
7.8.1 解决方案 340
7.8.2 写操作实验步骤 340
7.8.3 读操作实验步骤 342
7.8.4 小结 343
7.9 nfs先失效(数据损坏),primary后失效(数据损坏) 344
7.9.1 解决方案 344
7.9.2 写操作实验步骤 344
7.9.3 读操作实验步骤 346
7.9.4 小结 348
7.10 实验结论 348
第8章 cloudera ha namenode使用 349
8.1 ha namenode说明 350
8.2 cdh4b1版本hdfs集群配置 351
8.2.1 虚拟机安装 351
8.2.2 nn1配置 351
8.2.3 dn1~dn3配置 355
8.2.4 hdfs集群构建 358
8.3 ha namenode配置 361
8.3.1 nn1配置 361
8.3.2 其他节点配置 365
8.4 ha namenode使用 367
8.4.1 启动ha hdfs集群 367
8.4.2 第1次failover 368
8.4.3 模拟写操作 368
8.4.4 模拟active name node失效,第2次failover 369
8.3.5 模拟新的standby namenode加入 370
8.5 小结 371
本图书
来源:中国互动出版网
发表评论
-
【互动出版网】2013双12全场科技类图书6.5折封顶
2013-12-12 16:30 1170【互动出版网】2013双12全场科技类图书6.5折封顶 ... -
C#编程兵书
2013-08-28 17:43 1236《C#编程兵书》 基本信息 作者: 张志强 胡君 丛书 ... -
C++编程兵书
2013-08-28 17:24 1256《C++编程兵书》 基本 ... -
HTML+CSS网站开发兵书
2013-08-28 17:04 1427《HTML+CSS网站开发兵书 ... -
Java编程兵书
2013-08-27 17:57 1257《Java编程兵书》 基本 ... -
网络运维与管理2013超值精华本
2013-08-27 17:44 1384《网络运维与管理2013超值精华本》 基本信息 作者: ... -
HTML5游戏开发进阶指南
2013-08-27 17:26 1354《HTML5游戏开发进阶指 ... -
ASP.NET MVC 4高级编程(第4版)
2013-08-26 17:58 1124《ASP.NET MVC 4高级编程(第4版)》 基本信息 ... -
嗨翻C语言
2013-08-26 17:40 1208《嗨翻C语言》 基本信息 作者: (美)David Gr ... -
C++ Primer中文版(第5版)
2013-08-26 17:20 1171《C++ Primer中文版(第5版) 》 基本信息 作 ... -
云计算原理与实践
2013-08-20 17:02 595《云计算原理与实践》 基本信息 作者: 游小明 罗光春 ... -
微信公众平台搭建与开发揭秘
2013-08-20 16:53 1017《微信公众平台搭建与开发揭秘》 基本信息 作者: 易伟 ... -
精通iOS开发(第5版)
2013-08-20 16:25 1060《精通iOS开发(第5版)》 基本信息 原书名:Begi ... -
企业门户(Portal)项目实施方略与开发指南
2013-08-20 16:12 995《企业门户(Portal)项目实施方略与开发指南》 基本信 ... -
Java开发手册
2013-08-20 15:56 961《Java开发手册》 基本信息 作者: 桂颖 谷涛 出 ... -
Unity3D手机游戏开发
2013-08-08 17:33 1155《Unity3D手机游戏开发》 基本信息 作者: 金玺曾 ... -
矛与盾:黑客攻防命令大曝光
2013-08-08 16:30 806《矛与盾:黑客攻防命令大曝光》 基本信息 作者: awk ... -
视觉繁美:信息可视化方法与案例解析
2013-08-08 16:10 953《视觉繁美:信息可视 ... -
精益设计: 设计团队如何改善用户体验
2013-08-08 15:55 793《精益设计: 设计团队如何改善用户体验》 基本信息 原书 ... -
云计算与OpenStack(虚拟机Nova篇)
2013-08-08 15:19 967《云计算与OpenStack(虚拟机Nova篇)》 基本信 ...
相关推荐
《高可用性的HDFS——Hadoop分布式文件系统深度实践》专注于Hadoop分布式文件系统(hdfs)的主流ha解决方案,内容包括:hdfs元数据解析、hadoop元数据备份方案、hadoop backup node方案、avatarnode解决方案以及最新...
《HDFS——Hadoop分布式文件系统深度实践》这本书是针对Hadoop分布式文件系统(HDFS)的详尽指南,旨在帮助读者深入理解HDFS的工作原理、设计思想以及在实际应用中的最佳实践。HDFS是Apache Hadoop项目的核心组件之...
1.1 HDFS系统架构 1.2 HA定义 1.3 HDFS HA原因分析及应对措施 1.3.1 可靠性 1.3.2 可维护性 1.4 现有HDFS HA解决方案 1.4.1 Hadoop的元数据备份方案 1.4.2 Hadoop的SecondaryNameNode方案 1.4.3 Hadoop的Checkpoint ...
《高可用性的HDFS——Hadoop分布式文件系统深度实践》专注于Hadoop分布式文件系统(hdfs)的主流ha解决方案,内容包括:hdfs元数据解析、hadoop元数据备份方案、hadoop backup node方案、avatarnode解决方案以及最新...
《高可用性的HDFS——Hadoop分布式文件系统深度实践》专注于Hadoop分布式文件系统(hdfs)的主流ha解决方案,内容包括:hdfs元数据解析、hadoop元数据备份方案、hadoop backup node方案、avatarnode解决方案以及最新...
《高可用性的HDFS——Hadoop分布式文件系统深度实践》专注于Hadoop分布式文件系统(hdfs)的主流ha解决方案,内容包括:hdfs元数据解析、hadoop元数据备份方案、hadoop backup node方案、avatarnode解决方案以及最新...
本书《高可用性的HDFS: Hadoop分布式文件系统深度实践》专注于深入探讨和实践HDFS的HA问题,涵盖了HDFS元数据解析、Hadoop元数据备份方案、Hadoop Backup Node方案、AvatarNode解决方案以及最新的HA解决方案Cloudrea...
* 硬件错误:Hadoop分布式文件系统需要能够容忍硬件错误,确保数据的可靠性和可用性。 二、HDFS 重要名词解释 Hadoop分布式文件系统的核心组件包括: * Namenode:Namenode是Hadoop分布式文件系统的核心组件,...
Hadoop分布式文件系统(Hadoop Distributed File System, HDFS)是一种高度可靠且具有极高可扩展性的分布式文件系统,能够支持大规模的数据存储需求[1]。HDFS的设计理念源于Google的文件系统(Google File System, ...
HDFS(Hadoop Distributed File System,Hadoop分布式文件系统)作为这类系统的一个重要代表,其设计理念和实现细节具有典型的研究和应用价值。 分布式文件系统的一个关键特点是基于计算机集群结构,它能够将大规模...
### hadoop分布式文件系统搭建 #### 一、配置hadoop分布式文件系统环境搭建 ##### 1. 准备 在开始搭建Hadoop分布式文件系统之前,首先需要确保环境准备妥当。具体步骤包括: - **检查端口占用情况**:通过`...
Hadoop分布式文件系统(HDFS)是为处理大规模数据集而设计的一种高容错性的分布式存储系统。HDFS源于Apache Nutch项目,是Hadoop项目的一部分,旨在支持高吞吐量的数据访问,适用于大规模批量处理任务,而非常规的...
### Hadoop分布式文件系统(HDFS)架构及源码分析 #### 一、HDFS的架构和设计分析 ##### 1.1 引言 Hadoop分布式文件系统(HDFS)是一种专门为运行在通用硬件上的分布式文件系统而设计的解决方案。与其他分布式文件...
HDFS的设计灵感来源于Google的GFS(Google文件系统),其主要目标是提供高可用性、高性能和高容错性。 HDFS的核心特性包括: 1. **高性能**:通过数据分块和数据本地化,HDFS能够实现高效的并行处理,提高数据读取...
总的来说,Hadoop分布式文件系统HDFS以其高容错、高吞吐量和面向大数据处理的特点,成为大数据分析和处理的首选工具。其设计考虑了硬件故障、大规模数据处理、数据复制和分布的复杂性,确保了系统在大规模部署时的...
根据提供的文件信息,我们可以从标题、描述以及部分可见的内容中提炼出关于Hadoop分布式文件系统(HDFS)的相关知识点。 ### Hadoop分布式文件系统(HDFS) #### 一、简介 Hadoop分布式文件系统(Hadoop ...
### Hadoop分布式文件系统使用指南:深度解析与实践 #### 概述 Hadoop分布式文件系统(HDFS)是Hadoop框架的核心组成部分之一,旨在处理大规模数据集的存储与访问需求。HDFS的设计目标是在商用硬件上实现高容错性...
Hadoop分布式文件系统(HDFS)是Hadoop项目的核心组件之一,它提供了一个高吞吐量的数据访问机制,适合那些需要处理大量数据的应用程序。HDFS的设计目标是在商品硬件上实现可靠的数据存储和处理,通过将数据分布在...