一。概述
google包括三大核心技术:GFS(Goole文件系统),MapReduce(分布式计算系统),BigTable(分布式存储系统)。
1.GFS,底层,负责服务器、机器数据的存储。将大体积的数据库分成固定大小的数据块放到两到三个服务器上。当一个服务器发生故障时,可将数据迅速从另外一个服务器上恢复过来。
2.MapRdeuce,Google开发的编程工具,由于1TB的大规模数据集的并行计算。可将一个搜索任务分成数百个小任务,并行处理,将最终结果在后台合并,将最终结果返回到客户端。
3.BigTable,对半结构化数据进行分布存储与访问接口,是建立在GFS和MapReduce上的结构化分布式存储系统。
google的集群采用key/value的形式存储,可以增强系统的可扩展性(scalability)。扩展性体现下两点:(1)可以支持极大的数据存储;(2)可以支持数量很多的并发查询。
key/value模式相比于RDBMS模式存在缺陷:
(1)没有schema(数据库对象的集合),不提供数据之间的关系和数据的完备性,需要开发人员自己处理;
(2)人们对它的接口不熟悉,当前出现的做法是再key/value存储上添加一个类SQL的抽象接口层。
二。详述
1.GFS是google自己研发的适用于大规模分布式数据处理相关应用的、可扩展的分布式文件系统。处理的数据库大小为64M(windows处理的一般为4KB),有两部分组成,主服务器和块服务器。
主服务器节点保存的数据为:文件和块的命名空间;文件到块的映射;每一个块的副本位置。所有元数据是保存在主服务器的内存中,命名空间和映射保存在主服务器本地磁盘的日志中。通过日志,在宕机时恢复主服务器状态。
主服务器的值日保存了关键元素变化的历史记录,是GFS的核心。主服务器在日志增长超过一定大小时,执行检查点动作,在下次启动时从本地硬盘读这个最新检查点,检查点类似B-树形式。
HDFS是开源GFS。
分享到:
相关推荐
云计算框架是IT领域中一种基于互联网的计算方式,它通过共享计算资源,为用户提供便捷、高效、可扩展的计算服务。云计算通常分为三个主要层次,即软件即服务(Software as a Service, SaaS)、平台即服务(Platform ...
综上所述,云计算框架研究涉及的核心知识点包括:云计算的概念及其大数据时代背景、云计算的关键技术如虚拟化技术和数据存储技术、SOA技术及其在云计算框架中的应用,以及云数据管理技术。通过这些知识点的深入研究...
### VMware云计算框架概述 #### 一、VMware市场地位与财务状况 VMware自成立以来,迅速崛起成为全球领先的云计算和虚拟化技术提供商。截至2009年,其年收入达到20亿美元,第四季度交易额高达6.08亿美元,同比增长...
**谷歌云计算原理与应用** 谷歌云计算是互联网巨头Google提供的基于大规模分布式计算的一种服务,它将计算资源、存储资源以及各种应用程序服务通过网络提供给全球用户。本PPT深入浅出地探讨了谷歌云计算的核心原理...
【电子政务与政务外网云计算框架研究】 随着信息化的快速发展,电子政务(E-GOVERNMENT)已成为政府提高行政效率和服务质量的重要手段。政务外网作为电子政务的重要基础设施,其云计算框架的研究具有重大意义。政务外...
从文档内容中可以看出,谷歌云计算架构利用了先进的技术和框架,以支撑大规模数据处理、分布式存储和高速网络通信。这个架构不仅需要高度的可靠性和扩展性,同时也要在安全性、维护性和用户体验方面有优秀的表现。...
### Google 云计算三大论文中文版知识点总结 #### 一、Bigtable:一个分布式的结构化数据存储系统 **概述:** Bigtable 是 Google 设计的一种分布式结构化数据存储系统,旨在处理大规模数据集,通常涉及数千台...
在深入分析Hadoop云计算框架中的分布式数据库HBase研究之前,我们先了解一下Hadoop的背景和其核心组件。Hadoop是一个开源框架,它允许使用简单的编程模型在计算机集群上进行海量数据的存储和处理。由于其用Java语言...
【谷歌云计算教程】 在当前数字化转型的时代,云计算已经成为企业技术和业务发展的重要驱动力。Google作为全球领先的科技公司,其云计算服务——Google Cloud Platform (GCP) 提供了一系列强大的工具和服务,帮助...
《谷歌云计算论文》集合了谷歌在云计算领域的重要理论基础,包括GFS(Google File System)、MapReduce和Bigtable。这三篇论文详细阐述了谷歌如何处理海量数据,并为大规模分布式计算提供解决方案。以下是对这些核心...
这三篇论文共同构建了Google云计算基础设施的三大支柱,即分布式存储(GFS)、分布式数据表(BigTable)和分布式计算模型(MapReduce)。它们不仅深刻影响了Google自身的产品和服务,也启发了整个行业的创新,推动了...
"GOOGLE云计算培训教材"是针对这一领域的专业学习资料,旨在帮助对谷歌云计算平台感兴趣的学员深入理解和掌握相关技术。 谷歌云计算(Google Cloud Platform,简称GCP)是全球领先的云服务提供商之一,提供了包括...
【Google云计算系列课程】 这是一套全面介绍Google云计算技术的课程资料,涵盖了多个核心主题,旨在帮助学习者深入了解和掌握Google在云计算领域的创新与实践。课程不仅关注理论基础,更注重实际应用,使得学员能够...
在IT行业中,Google云计算是不可或缺的一部分,而"Google云计算的三大论文"则被视为该领域的经典之作,对于理解和掌握云计算核心技术有着至关重要的作用。这三篇论文分别是《MapReduce:简化大规模数据集处理》、...
在IT行业中,Google云计算是现代云服务的先驱,其技术理念和技术框架对整个行业产生了深远影响。这里提到的“Google云计算三大论文中文版”包含了谷歌在早期对大规模分布式计算系统进行理论化和实践化的关键文献。这...
这三篇论文共同构建了谷歌云计算的基础框架,不仅支撑了谷歌自身服务的高效运行,也启发了Hadoop、HBase、Cassandra等开源项目,推动了整个云计算行业的进步。它们强调的分布式、容错、并行处理和大数据管理理念,...
"google云计算课程module"是针对教育和专业人士设计的一门深入探讨Google云计算技术的课程,旨在提升学员对大规模集群计算的理解和应用能力。 该课程可能涵盖以下几个核心知识点: 1. **Google Cloud Platform ...
在本压缩包“Google云计算的一些资料”中,包含的是Google公司关于云计算的课程讲座内容,这对于想要深入了解或学习云计算的朋友们来说,无疑是一份宝贵的资源。Google作为全球领先的科技公司,其在云计算领域的技术...