liuxinglanyue

浏览: 565260 次
性别:
来自: 杭州

最近访客更多访客>>

hui963966800

lhc98

guoshun0321

kidding87

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

2011-02 ( 10)
2011-01 ( 22)
2010-12 ( 165)
更多存档...

云计算背后的秘密（2）-GFS（转）

博客分类：

分布式与海量数据

云计算 Google Hadoop Mapreduce 搜索引擎

由于周日Linode在加州机房出现停电事故，所以这两天PeopleYun没法访问，在这里向大家表示歉意

由于搜索引擎需要处理海量的数据，所以Google的两位创始人Larry Page和Sergey Brin在创业初期设计一套名为“BigFiles”的文件系统，而GFS（全称为“Google File System”）这套分布式文件系统则是“BigFiles”的延续。

技术概览

首先，介绍它的架构，GFS主要分为两类节点：其一是Master节点，其主要存储与数据文件相关的元数据，而不是Chunk（数据块）。元数据包括一个能将64位标签映射到数据块的位置及其组成文件的表格，数据块副本位置和哪个进程正在读写特定的数据块等。还有Master节点会周期性地接收从每个Chunk节点来的更新（“Heart-beat”）来让元数据保持最新状态；其二是Chunk节点，它主要用于存储数据。在每个Chunk节点上，数据文件会以每个默认大小为64MB Chunk的方式存储，而且每个Chunk有唯一一个64位标签，并且每个Chunk都会在整个分布式系统被复制多次，默认次数为3。下图就是GFS的架构图：

图1. GFS的架构图

接着，在设计上，GFS主要有八个特点：

1. 大文件和大数据块：数据文件的大小普遍在GB级别，而且其每个数据块默认大小为64MB，这样做的好处是减少了元数据的大小，从而能使Master节点能够非常方便地将元数据都放置在内存中以提升访问效率。
2. 操作以添加为主：文件很少会被删减或者覆盖，通常只是进行添加或者读取操作，这样能充分考虑到硬盘线性吞吐量大，但随机读写慢的特点。
3. 支持容错：首先，虽然当时为了设计方便，采用了单Master的方案，但是整个系统会保证Master节点会有其相对应的替身（Shadow），以便于当Master节点出现问题时进行切换。其次，在Chunk层，GFS已经在设计上将节点失败视为常态，所以能非常好地处理Chunk节点失效的问题。
4. 高吞吐量：虽然以单个节点来看，GFS的性能无论是从吞吐量还是延迟都很普通，但因为其支持上千的节点，所以总的数据吞吐量是非常惊人的。
5. 保护数据：文件被分割成固定尺寸的数据块以便于保存，而且每个数据块都会被系统至少复制三份。
6. 扩展能力强：因为元数据偏小，使得一个Master节点能控制和管理上千个存数据的Chunk节点。
7. 支持压缩：对于那些稍旧的文件，可以通过对它进行压缩，来节省硬盘空间，并且压缩率非常惊人，有时甚至接近90%。
8. 基于用户空间：GFS主要运行于系统的用户空间（User Time），虽然在效率方面，用户空间比内核空间略低，但是更便于开发和测试，还有，就是能更好利用Linux的自带的一些POSIX API。

优劣点

由于GFS主要是为了存储海量搜索数据而设计的，所以它在吞吐量（Throughput）和伸缩性（Scalability）这两方面表现非常优异，可谓业界的“翘楚”，但是由于其主要以64MB数据块形式存储，所以在随机访问方面速度并不优秀，虽然这点可谓是它的“软肋”，但是这本身也是其当初为了吞吐量和伸缩性所做的权衡。

实际用例

现在Google内部至少运行着200多个GFS集群，最大的集群有几千台服务器，数据量是PB级别的，并且服务于多个Google服务，包括Google搜索和Google Earth等。同时，在最近几年，由于上面提到的高延迟问题，所以GFS并不很适合新的一些Google产品，比YouTube、Gmail和非常强调实时性的Caffeine搜索引擎等，所以Google已经在开发下一代GFS，代号为“Colossus”，并且在设计方面有许多不同，比如，支持分布式Master节点来提升高可用性并支撑更多文件和chunk节点能支持1MB大小的chunk以支撑低延迟应用的需要等，希望等Colossus成熟的时候，Google也能像当初GFS那样，将其设计的细节和经验拿出来和大家分享。

分享到：

云计算背后的秘密（3）-BigTable（转） | 云计算背后的秘密（1）-MapReduce（转）

2010-12-20 20:30
浏览 883
评论(0)
分类:互联网
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

云计算背后的秘密（2）-GFS（转）

技术概览

优劣点

相关产品

实际用例

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

云计算背后的秘密（2）-GFS（转）

技术概览

优劣点

相关产品

实际用例

评论

发表评论

相关推荐

Google新一代实时搜索系统的核心机制

为什么云计算是比较安全的？

北大的分布式系统在线教材（转）

云计算背后的秘密（5）-Google的数据中心优化技术（转）

云计算背后的秘密（4）-Chubby（转）

云计算背后的秘密（3）-BigTable（转）

云计算背后的秘密（1）-MapReduce（转）

Bigtable：一个分布式的结构化数据存储系统(转载)

YunTable开发日记（3） – BigTable的数据模型和调用接口(转)

【google论文四】Bigtable:结构化数据的分布式存储系统(下)

【google论文四】Bigtable:结构化数据的分布式存储系统(上)

海量查询的数据优化（补充）

海量查询的数据优化

google 背后的分布式架构(三) 转载

google 背后的分布式架构(二) 转载

google背后的分布式架构(一) 转载

海量数据分析：Sawzall并行处理（中文版论文 二）

海量数据分析：Sawzall并行处理（中文版论文 一）

【google论文三】MapReduce:简化大集群上的数据处理(下)

【google论文三】MapReduce:简化大集群上的数据处理(上)

最近访客更多访客>>

海量数据分析：Sawzall并行处理（中文版论文二）

海量数据分析：Sawzall并行处理（中文版论文一）