`
QING____
  • 浏览: 2253338 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

GFS学习(三)

 
阅读更多
、容错和诊断

  4.1 高可靠性

  4.1.1 快速恢复

  不管如何终止服务,MASTER和数据块服务器都会在几秒钟内恢复状态和运行。实际上,我们不对正常终止和不正常终止进行区分, 服务器进程都会被切断而终止。客户机和其他的服务器会经历一个小小的中断,然后它们的特定请求超时,重新连接重启的服务器,重新请求。

  4.1.2 数据块备份

  如上文所讨论的,每个数据块都会被备份到放到不同机架上的不同服务器上。对不同的名字空间,用户可以设置不同的备份级别。在数据块服务器掉线或是数据被破坏时,MASTER会按照需要来复制数据块。

  4.1.3 MASTER备份

  为确保可靠性,MASTER的状态、操作记录和检查点都在多台机器上进行了备份。一个操作只有在数据块服务器硬盘上刷新并被记录在MASTER和其备份的上之后才算是成功的。如果MASTER或是硬盘失败,系统监视器会发现并通过改变域名启动它的一个备份机,而客户机则仅仅是使用规范的名称来访问,并不会发现MASTER的改变。

  4.2 数据完整性

  每个数据块服务器都利用校验和来检验存储数据的完整性。原因:每个服务器随时都有发生崩溃的可能性,并且在两个服务器间比较数据 块也是不现实的,同时,在两台服务器间拷贝数据并不能保证数据的一致性。

  每个Chunk64kB的大小分成块,每个块有32位的校验和,校验和和日志存储在一起,和用户数据分开。

  在读数据时,服务器首先检查与被读内容相关部分的校验和,因此,服务器不会传播错误的数据。如果所检查的内容和校验和不符,服务器就会给数据请求者返回一个错误的信息,并把这个情况报告MASTER。客户机就会读其他的服务器来获取数据,而MASTER 则会从其他的拷贝来复制数据,等到一个新的拷贝完成时,MASTER就会通知报告错误的服务器删除出错的数据块。

  附加写数据时的校验和计算优化了,因为这是主要的写操作。我们只是更新增加部分的校验和,即使末尾部分的校验和数据已被损坏而我 们没有检查出来,新的校验和与数据会不相符,这种冲突在下次使用时将会被检查出来。

  相反,如果是覆盖现有数据的写,在写以前,我们必须检查第一和最后一个数据块,然后才能执行写操作,最后计算和记录校验和。如果 我们在覆盖以前不先检查首位数据块,计算出的校验和则会因为没被覆盖的数据而产生错误。

  在空闲时间,服务器会检查不活跃的数据块的校验和,这样可以检查出不经常读的数据的错误。一旦错误被检查出来,服务器会拷贝一个 正确的数据块来代替错误的。

  4.3 诊断工具

  广泛而细致的诊断日志以微小的代价换取了在问题隔离、诊断、性能分析方面起到了重大的作用。GFS服务器用日志来记录显著的事件(例如服务器停机和启动)和远程的应答。远程日志记录机器之间的请求和应答,通过收集不同机器上的日志记录,并对它们进行分析恢复,我们可以完整地重现活动的场景,并用此来进行错误分析。

  6 测量

  6.1 测试环境

  一台主控机,两台主控机备份,16台数据块服务器,16台客户机。

  每台机器:2PIII1.4G处理器,2G内存,280G5400rpm的硬盘,1100Mbps全双工网卡

  19台服务器连接到一个HP2524交换机上,16台客户机俩接到领外一台交换机上,两台交换机通过1G的链路相连。

  以前研究过google文件系统 说实话设计的比较简单而且最重要的是可靠性强 整个google 分成 数据机群 文件集群 文件机群可以看成是网格技术.

 

--END--

 

[GFS学习(一):http://shift-alt-ctrl.iteye.com/blog/1842191]

[GFS学习(二):http://shift-alt-ctrl.iteye.com/blog/1842217]

分享到:
评论

相关推荐

    谷歌BigTable GFS MapReduce三大论文中文版

    谷歌的BigTable、GFS(Google File System)和MapReduce是大数据处理领域的三大经典技术,它们为现代互联网公司的数据存储和处理奠定了基础。这三篇论文的中文版为我们提供了深入理解这些技术的宝贵资料。 首先,让...

    Google三篇论文-GFS英文版.pdf

    ### Google三篇论文-GFS知识点解析 #### 一、引言与背景 《Google三篇论文-GFS英文版.pdf》是一份重要的技术文档,详细介绍了Google文件系统(Google File System, GFS)的设计原理和技术特点。这篇论文由Google...

    Gfs Paper.rar

    通过深入理解和学习GFS,我们可以更好地理解大数据处理的挑战和解决方案,这对于从事云计算、大数据领域的专业人士来说是必不可少的知识基础。阅读这篇论文,不仅可以了解GFS的具体实现,还能启发我们思考如何设计和...

    Google大数据三大论文中文版下载 Google论文MapReduce、GFS、Bigtable论文下载

    在IT行业中,Google的大数据处理技术是不可或缺的重要组成部分。...下载这三篇论文的中文版,可以帮助我们深入理解Google在大数据处理领域的创新思维和技术实现,对于学习和研究大数据技术具有极高的价值。

    Google-GFS,Bigtable,Mapreduce三大论文英文原版+中文翻译

    《Google-GFS》、《Bigtable》和《MapReduce》是Google公司发布的三篇具有里程碑意义的学术论文,它们揭示了Google如何处理和管理海量数据的内部机制,为分布式计算和大数据处理领域奠定了坚实的基础。这三篇论文的...

    Hadoop GFS

    本篇将深入探讨这三个概念及其相互关系。 首先,GFS是Google设计的一种分布式文件系统,它为大规模数据处理提供了高效、容错性极强的存储解决方案。GFS的核心设计理念是将大文件分割成多个小块(通常为64MB),并...

    Google GFS

    这些扩展包括对大文件的支持、高效的流式数据读写操作等,使得GFS能够无缝地集成到各种复杂的应用场景中,如搜索引擎、数据分析和机器学习等领域。 #### 实际应用与效果 GFS在Google内部得到了广泛应用,作为存储...

    GFS BigTable MapReduce中文版

    标题中的“GFS BigTable MapReduce中文版”指的是Google三篇经典的分布式系统论文的中文翻译版本,这三篇论文在IT行业中具有极高的影响力,尤其是对于从事云计算、大数据处理和分布式存储领域的专业人士而言。...

    GFS分布式文件系统实验包

    这个实验包是针对GFS的一个学习资源,旨在帮助用户理解和掌握分布式文件系统的原理和操作。在Linux环境中,GFS是一种关键的技术,因为它能够提供高可用性、可扩展性和容错性,对于处理大数据量的计算任务至关重要。 ...

    谷歌GFS+Mapreduce+Bigtable三大论文中英文+PDF+WORD版本

    谷歌的GFS、MapReduce和Bigtable是大数据处理和分布式计算领域的里程碑式创新,这三者构成了谷歌的基础架构,对整个互联网行业产生了深远影响。现在,我们拥有的是一份包含这些核心论文的2021年修正版集合,涵盖了中...

    Google大数据三大论文 三合一 中文版 GFS MapReduce BigTable

    通过学习GFS,我们可以了解如何构建高可用的分布式文件系统;通过MapReduce,我们可以掌握如何编写处理海量数据的并行程序;通过BigTable,我们可以理解如何设计适应大规模数据的分布式数据库。这些知识对于从事大...

    Google三大篇著名论文Paper 机器学习AI必读 GFS MapReduce BigTable

    A Distributed Storage System for Structured Data"(2008年TOCS期刊)——是机器学习和人工智能从业者必读的经典文献。这三篇论文分别介绍了Google如何解决大规模数据处理、分布式文件系统和结构化数据存储的挑战...

    gfs+BigTable+map reduce 三合一.zip

    在IT行业中,Google File System (GFS),BigTable和MapReduce是三个至关重要的技术,它们在大规模数据处理和分布式计算领域扮演着核心角色。这里,我们将深入探讨这三个概念及其关联。 首先,Google File System...

    谷歌三篇大数据的著名论文(译文)

    它们奠定了现代大数据基础设施的基础,对于理解大数据处理的原理和技术发展有着重要的学习价值。通过深入研究这些论文,我们可以更好地掌握如何设计和优化大数据解决方案,以应对日益增长的数据量和复杂性。

    Google大数据三大论文(GFS/BigTable/MapReduce)

    在IT行业中,Google大数据三大论文——GFS(Google File System)、Bigtable和MapReduce,对分布式计算领域产生了深远影响。这些论文详细阐述了Google如何处理和管理海量数据,为后来的开源项目如Hadoop提供了理论...

    Google大数据三大论文英文版下载 Google论文MapReduce、GFS、Bigtable论文下载英文版

    Google大数据三篇经典论文——MapReduce、GFS(Google File System)以及Bigtable,对于理解大规模数据处理的基础架构和技术至关重要。这三篇论文分别深入探讨了分布式计算模型、大规模文件系统和结构化数据存储系统...

    Google三大核心技术 pdf big_data map reduce gfs

    标题中的“Google三大核心技术”指的是Google在大数据处理领域所开创的三项关键技术,它们分别是:Bigtable、MapReduce和GFS(Google File System)。这三项技术是Google内部大规模数据处理的基础,对现代云计算和大...

    google 大数据 三论文【GFS , MapReduce, BigTable】 英文版

    在IT行业中,Google是大数据处理技术的先驱,其提出的三篇标志性论文——"The Google File System"(GFS)、"MapReduce: Simplified Data Processing on Large Clusters"和"Bigtable: A Distributed Storage System ...

    google三大论文 gfs bigtable mapreduce hadoop hdfs hbase的原型

    ### Google三大论文与Hadoop生态系统的关键技术 #### 一、Google三大论文概述 Google三大论文分别指的是《Google File System》、...通过深入学习这些论文,我们可以更好地理解和应用当前的大数据处理技术。

    GFS+MapRed+BigTab.zip

    这三篇论文分别详细阐述了GFS、MapReduce和Bigtable的设计原理和实践经验,对于理解大数据处理和分布式计算有着重要的参考价值。GFS解决了大数据存储问题,MapReduce提供了处理大规模数据的有效计算模型,而Bigtable...

Global site tag (gtag.js) - Google Analytics