`
lingqi1818
  • 浏览: 252175 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

bigtable

阅读更多
BIGTABLE

一个结构化数据的分布式数据存储系统,主要解决大数据量存储的问题。
数据模型为:



Rows 通过行键来指定,例如com.cnn.www
Column Families  Column keys are grouped into sets called column families,
which form the basic unit of access control. All data
stored in a column family is usually of the same type (we
compress data in the same column family together). A
column family must be created before data can be stored
under any column key in that family; after a family has
been created, any column key within the family can be
used. It is our intent that the number of distinct column
families in a table be small (in the hundreds at most), and
that families rarely change during operation. In contrast,
a table may have an unbounded number of columns.
Timestamps 时间戳,用于指定版本号


Bigtable的底层存储为例如GFS之类的分布式文件系统。
The Google SSTable _le format is used internally to
store Bigtable data. An SSTable provides a persistent,
ordered immutable map from keys to values, where both
keys and values are arbitrary byte strings.

Bigtable relies on a highly-available and persistent
distributed lock service called Chubby

Chubby我个人理解为是一种文件锁,例如table server,master等存活检测,或者是表是否存在的检测都需要依靠它。




Each tablet is assigned to one tablet server at a time. The
master keeps track of the set of live tablet servers, and
the current assignment of tablets to tablet servers, including
which tablets are unassigned. When a tablet is
unassigned, and a tablet server with suf_cient room for
the tablet is available, the master assigns the tablet by
sending a tablet load request to the tablet server.

Bigtable uses Chubby to keep track of tablet servers.
When a tablet server starts, it creates, and acquires an
exclusive lock on, a uniquely-named _le in a speci_c
Chubby directory. The master monitors this directory
(the servers directory) to discover tablet servers. A tablet
server stops serving its tablets if it loses its exclusive
lock: e.g., due to a network partition that caused the
server to lose its Chubby session. (Chubby provides an
ef_cient mechanism that allows a tablet server to check
whether it still holds its lock without incurring network
traf_c.) A tablet server will attempt to reacquire an exclusive
lock on its _le as long as the _le still exists. If the
_le no longer exists, then the tablet server will never be
able to serve again, so it kills itself. Whenever a tablet
server terminates (e.g., because the cluster management
system is removing the tablet server's machine from the
cluster), it attempts to release its lock so that the master
will reassign its tablets more quickly.

Table server的工作原理:




更多细节可以阅读:
http://labs.google.com/papers/bigtable.html
  • 大小: 31.5 KB
  • 大小: 31.8 KB
  • 大小: 21.8 KB
分享到:
评论
1 楼 jiaoyingjun 2010-09-26  
好文章,不错。研究的很透彻。。。

相关推荐

    Bigtable: A Distributed Storage System for Structured Data中文翻译

    ### Bigtable:结构化数据的分布式存储系统 #### 引言与重要性 Bigtable,中文译为“大表”,是Google开发的一款用于大规模结构化数据的分布式存储系统。其设计初衷是为了应对互联网时代海量数据的存储与管理需求...

    Bigtable:一个分布式的结构化数据存储系统[中文版] pdf

    ### Bigtable:一个分布式的结构化数据存储系统 #### 概述 Bigtable是由Google开发的一个分布式的结构化数据存储系统。它旨在处理大规模的数据集,即PB级别的数据,这些数据通常分布在数千台普通的服务器上。...

    Google 三大论文中英双文版(GFS、MapReduce 和 BigTable).zip

    《Google 三大核心技术:GFS、MapReduce与BigTable》 在信息技术的快速发展中,Google以其独特的创新精神和卓越的技术实力,引领了大数据处理的新纪元。GFS(Google File System)、MapReduce和BigTable是Google的...

    google-bigtable中文版

    ### Google Bigtable中文版知识点详解 #### 一、Bigtable简介 Bigtable是谷歌开发的一款分布式、大规模数据存储系统,其主要设计目的是处理PB级别的数据,即能够在数千台普通的服务器上进行高效的数据管理。该系统...

    Google BigTable中文版.pdf

    ### 关于Google BigTable的关键知识点 #### 一、概述与背景 - **BigTable简介**:Google BigTable是一个由Google开发的分布式存储系统,能够支持非常庞大的数据集,包括PB级别的数据规模,运行在数千台商用服务器上...

    google三篇论文之一 Bigtable

    ### Bigtable 数据模型与设计 #### 一、概述 Bigtable是谷歌开发的一款分布式存储系统,主要用于处理大规模数据集,其设计目标在于提供一个既可靠又能处理PB级别数据的平台。这种规模的数据处理能力使得Bigtable...

    谷歌Bigtable File-System MapReduce论文

    谷歌的三篇经典论文——Bigtable、File-System和MapReduce,对现代大数据处理和分布式系统的发展产生了深远影响。这三篇文章分别详细介绍了谷歌在数据存储、文件系统和大规模并行计算上的创新解决方案。 首先,让...

    Google大数据三大论文中文版下载 Google论文MapReduce、GFS、Bigtable论文下载

    这些技术包括MapReduce、GFS(Google File System)和Bigtable,它们对现代大数据处理和云计算的发展产生了深远影响。以下是这三项技术的详细介绍: 1. MapReduce: MapReduce是一种编程模型,用于大规模数据集的...

    Google's BigTable 原理 (中文)

    **Google's BigTable原理概述** Google的BigTable是一款强大的分布式数据存储系统,旨在处理大规模的半结构化数据。它的设计理念和实现技术对于现代云服务和大数据处理有着深远的影响。BigTable的设计灵感来源于...

    Bigtable: A Distributed Storage System for Structured Data

    ### Bigtable:面向结构化数据的分布式存储系统 #### 概述 Bigtable是谷歌开发的一款用于管理结构化数据的分布式存储系统。该系统旨在处理非常庞大的数据量——可达PB级别,并能部署在成千上万台低成本服务器上。...

    Google三大论文之BigTable中文完整版

    ### Bigtable:一个分布式的结构化数据存储系统 #### 概述 Bigtable是Google开发的一个分布式、结构化的数据存储系统,旨在处理PB级的数据规模,适用于多种应用场景,包括但不限于Web索引、Google Earth和Google ...

    Bigtable:一个分布式的结构化数据存储系统

    《Bigtable:分布式结构化数据存储系统的解析》 Bigtable是由Google开发的一种大规模分布式数据库,主要用于存储和管理结构化的数据。作为Google基础架构的关键组成部分,它支撑了诸如Google搜索、Gmail、Google ...

    Google三篇论文-BigTable英文版

    **BigTable:Google的分布式数据存储系统** BigTable是由Google开发的一种分布式数据存储系统,用于支持大规模、结构化的数据处理。这篇论文详细介绍了BigTable的设计理念、架构以及它如何满足Google内部各种服务的...

    BigTable A Distributed Storage System for Structured Data

    《BigTable:分布式结构化数据存储系统》 BigTable是由Google开发的一个分布式存储系统,专门用于管理和存储结构化数据,其设计目标是能够扩展到极大规模,处理PB级别的数据,并且能在数千台普通的服务器上运行。...

    大数据经典论文MapReduce、GFS、Bigtable中文版

    本文所涉及的Google三大论文:MapReduce、GFS和Bigtable,正是这一领域内具有里程碑意义的研究成果。接下来,我将详细解读这三篇论文的核心知识点,并结合论文中文版的内容进行阐述。 首先,MapReduce是Google提出...

Global site tag (gtag.js) - Google Analytics