BIGTABLE
一个结构化数据的分布式数据存储系统,主要解决大数据量存储的问题。
数据模型为:
Rows 通过行键来指定,例如com.cnn.www
Column Families Column keys are grouped into sets called column families,
which form the basic unit of access control. All data
stored in a column family is usually of the same type (we
compress data in the same column family together). A
column family must be created before data can be stored
under any column key in that family; after a family has
been created, any column key within the family can be
used. It is our intent that the number of distinct column
families in a table be small (in the hundreds at most), and
that families rarely change during operation. In contrast,
a table may have an unbounded number of columns.
Timestamps 时间戳,用于指定版本号
Bigtable的底层存储为例如GFS之类的分布式文件系统。
The Google SSTable _le format is used internally to
store Bigtable data. An SSTable provides a persistent,
ordered immutable map from keys to values, where both
keys and values are arbitrary byte strings.
Bigtable relies on a highly-available and persistent
distributed lock service called Chubby
Chubby我个人理解为是一种文件锁,例如table server,master等存活检测,或者是表是否存在的检测都需要依靠它。
Each tablet is assigned to one tablet server at a time. The
master keeps track of the set of live tablet servers, and
the current assignment of tablets to tablet servers, including
which tablets are unassigned. When a tablet is
unassigned, and a tablet server with suf_cient room for
the tablet is available, the master assigns the tablet by
sending a tablet load request to the tablet server.
Bigtable uses Chubby to keep track of tablet servers.
When a tablet server starts, it creates, and acquires an
exclusive lock on, a uniquely-named _le in a speci_c
Chubby directory. The master monitors this directory
(the servers directory) to discover tablet servers. A tablet
server stops serving its tablets if it loses its exclusive
lock: e.g., due to a network partition that caused the
server to lose its Chubby session. (Chubby provides an
ef_cient mechanism that allows a tablet server to check
whether it still holds its lock without incurring network
traf_c.) A tablet server will attempt to reacquire an exclusive
lock on its _le as long as the _le still exists. If the
_le no longer exists, then the tablet server will never be
able to serve again, so it kills itself. Whenever a tablet
server terminates (e.g., because the cluster management
system is removing the tablet server's machine from the
cluster), it attempts to release its lock so that the master
will reassign its tablets more quickly.
Table server的工作原理:
更多细节可以阅读:
http://labs.google.com/papers/bigtable.html
data:image/s3,"s3://crabby-images/cb5a2/cb5a2503565fc2404c0bf3d3e22638db9d28abce" alt="点击查看原始大小图片"
- 大小: 31.5 KB
data:image/s3,"s3://crabby-images/9cf38/9cf38f14d0210924e9997ef96dbdd029b7493fa2" alt="点击查看原始大小图片"
- 大小: 31.8 KB
data:image/s3,"s3://crabby-images/cbd82/cbd82a03dd0ea11d0478a79b6d9d2116ae0f4b7b" alt="点击查看原始大小图片"
- 大小: 21.8 KB
分享到:
相关推荐
### Bigtable:结构化数据的分布式存储系统 #### 引言与重要性 Bigtable,中文译为“大表”,是Google开发的一款用于大规模结构化数据的分布式存储系统。其设计初衷是为了应对互联网时代海量数据的存储与管理需求...
标题中提到的Bigtable是谷歌公司推出的一种分布式存储系统,专门用于处理结构化数据。在描述中明确指出,Bigtable并非关系型数据库,而是一个巨大的、结构化数据存储的表格系统。结构化数据是指那些存储在固定字段中...
### Bigtable:一个分布式的结构化数据存储系统 #### 概述 Bigtable是由Google开发的一个分布式的结构化数据存储系统。它旨在处理大规模的数据集,即PB级别的数据,这些数据通常分布在数千台普通的服务器上。...
### Bigtable:分布式结构化数据存储系统 #### 一、简介与背景 Bigtable是由Google设计、实现并部署的一个分布式结构化数据存储系统,旨在可靠地处理PB级别的数据,并能够扩展到数千台普通服务器上。自2006年发布...
《Google 三大核心技术:GFS、MapReduce与BigTable》 在信息技术的快速发展中,Google以其独特的创新精神和卓越的技术实力,引领了大数据处理的新纪元。GFS(Google File System)、MapReduce和BigTable是Google的...
Google的Bigtable是一个分布式存储系统,专门用于管理结构化数据。它的设计目的是为了能够扩展到非常大的规模,可以管理跨数千台商用服务器的数以petabytes(千万亿字节)的数据。Bigtable在Google的多个项目中得到...
### Google Bigtable中文版知识点详解 #### 一、Bigtable简介 Bigtable是谷歌开发的一款分布式、大规模数据存储系统,其主要设计目的是处理PB级别的数据,即能够在数千台普通的服务器上进行高效的数据管理。该系统...
### 关于Google BigTable的关键知识点 #### 一、概述与背景 - **BigTable简介**:Google BigTable是一个由Google开发的分布式存储系统,能够支持非常庞大的数据集,包括PB级别的数据规模,运行在数千台商用服务器上...
### Bigtable 数据模型与设计 #### 一、概述 Bigtable是谷歌开发的一款分布式存储系统,主要用于处理大规模数据集,其设计目标在于提供一个既可靠又能处理PB级别数据的平台。这种规模的数据处理能力使得Bigtable...
谷歌的三篇经典论文——Bigtable、File-System和MapReduce,对现代大数据处理和分布式系统的发展产生了深远影响。这三篇文章分别详细介绍了谷歌在数据存储、文件系统和大规模并行计算上的创新解决方案。 首先,让...
这些技术包括MapReduce、GFS(Google File System)和Bigtable,它们对现代大数据处理和云计算的发展产生了深远影响。以下是这三项技术的详细介绍: 1. MapReduce: MapReduce是一种编程模型,用于大规模数据集的...
**Google's BigTable原理概述** Google的BigTable是一款强大的分布式数据存储系统,旨在处理大规模的半结构化数据。它的设计理念和实现技术对于现代云服务和大数据处理有着深远的影响。BigTable的设计灵感来源于...
### Bigtable:一个分布式的结构化数据存储系统 #### 概述 Bigtable是Google开发的一个分布式、结构化的数据存储系统,旨在处理PB级的数据规模,适用于多种应用场景,包括但不限于Web索引、Google Earth和Google ...
《Bigtable:分布式结构化数据存储系统的解析》 Bigtable是由Google开发的一种大规模分布式数据库,主要用于存储和管理结构化的数据。作为Google基础架构的关键组成部分,它支撑了诸如Google搜索、Gmail、Google ...
【BigTable简介】 BigTable是由Google开发的一种分布式结构化数据存储系统,专为处理大规模数据而设计,能够处理分布在数千台普通服务器上的PB级数据。它在2006年的OSDI大会上首次被详细介绍,其核心特性使得它成为...
**BigTable:Google的分布式数据存储系统** BigTable是由Google开发的一种分布式数据存储系统,用于支持大规模、结构化的数据处理。这篇论文详细介绍了BigTable的设计理念、架构以及它如何满足Google内部各种服务的...
《BigTable:分布式结构化数据存储系统》 BigTable是由Google开发的一个分布式存储系统,专门用于管理和存储结构化数据,其设计目标是能够扩展到极大规模,处理PB级别的数据,并且能在数千台普通的服务器上运行。...
本文所涉及的Google三大论文:MapReduce、GFS和Bigtable,正是这一领域内具有里程碑意义的研究成果。接下来,我将详细解读这三篇论文的核心知识点,并结合论文中文版的内容进行阐述。 首先,MapReduce是Google提出...
标题中的“GFS BigTable MapReduce中文版”指的是Google三篇经典的分布式系统论文的中文翻译版本,这三篇论文在IT行业中具有极高的影响力,尤其是对于从事云计算、大数据处理和分布式存储领域的专业人士而言。...