`
in355hz
  • 浏览: 230296 次
社区版块
存档分类
最新评论

漫谈事务和分布式事务(2)- 数据库 ACID 的实现

阅读更多
回到事务这个话题。上一篇提到:
 
数据库事务 = ACID
 
ACID 并不是一个纸面理论。这个世界上有成千上万台满足 ACID 特性的数据库运行在大大小小的机构、政府部门和企业,为各式各样的复杂业务提供服务。其中有银行、电信、统计机构、实验室,以及你正在访问的网站。如果全球的数据库同时崩溃,那也许是一场世界末日,嘭!
 
让我先烧个香膜拜一下,然后很肤浅的看一下数据库实现 ACID 的方法。
 
数据库 ACID 的实现
 
基本上,数据库实现 ACID 最关键的技术是日志和锁。
 
A - 数据库依赖 Redo / undo 日志实现事务的原子性。 
 
      简单来说,Redo 日志记录事务后的修改数据, Undo 日志记录事务前的原始数据。在恢复时,数据库先检查事务中断在什么阶段:如果事务中断在 commit 阶段,则重放 Redo 日志;如果中断在 prepare 阶段,则利用 Undo 日志进行回滚。
 
      数据库用 检查点(check-point)确定事务的恢复位点。检查点代表:在这一点之前提交的事务所修改的数据已经全部写回磁盘。因此,数据库故障后只要找到最近一次检查点,就可以从这个位置开始处理 Redo / undo 日志。
 
C - 用类型检查、唯一索引、外键约束和级联更新保护数据的完整性。
 
I - 实现事务隔离的主要手段是锁。另外一个关键技术是 MVCC (Multi-version Concurrency Control), 它可以在一些场景避免加锁, 实现同时读写。
 
    不同的隔离级别在数据库中的加锁策略不一样:
 
    Read uncommitted - 读不需要加锁,写仅仅需要加行锁。
 
    Read committed - 需要加写锁,读必须等待写事务结束。
 
    Repeatable reads - 需要加读锁,当有事务在读一行记录,其他写同一行的事务都会阻塞。
 
    Serializable - 需要加范围锁,当有事务 SELECT 某个范围的数据时,其他访问同一范围的事务都会阻塞。
 
    MVCC 则优化了事务读的场景。数据库保存记录的多个版本,在进行更新时,其他只读事务 / 非事务读可以直接访问记录的上一个版本,不需要等待锁。
 
    引入锁在数据库层面上带来了另一个问题:事务中数据的更新不一定是有序的,因此请求锁的顺序也是无序的。无序的加锁必然会导致死锁。因此数据库实现了另一套机制:死锁检测,来防止业务陷入死锁。
 
    单机数据库实现死锁检测的基本办法(ps. 集中式死锁检测)是维护一个活动事务列表,记录每个活动事务上持有和等待的锁。这样——当加锁时,数据库有足够的信息判断等待这一个锁会不会形成闭环,从而识别和阻止死锁。
 
D - 数据库的持久化依赖磁盘和数据复制机制。
 
      在 linux 下,软件可以用 fsync 保证数据真正写入磁盘 / RAID 卡。另一方面,为了解决 RAID 恢复慢的问题,大部分数据库都支持以数据复制方式实现的 热备机制。一旦数据库发生故障,可以立即用备库代替故障的主库,不用等待较慢的 RAID 数据恢复。
 
总之,单机数据库 已经有一套很成熟的经验和理论,可以在合理的性能下实现业务需要的 ACID 特性。—— 但是,这套经验和理论还面临一个问题:
 
单机的硬件性能总是有上限的。
 
目前来看,ACID 事务处理的顶峰是 Oracle ——大概 500,000 TPS 每节点。这个数字是在小型机和高端存储设备上达到的 ——而一套这样的设备价值大约是 $30,000,000。
 
显然。当业务增长到单个数据库节点再也容纳不了的时候,自然需要扩容到多个节点。为了有效的维护多个节点上的数据,业务需要能够在多个节点 ——或者说在 分布式环境 上实现 ACID 事务的理论。
 
下一篇我准备深入介绍一些 这样的理论
 
敬请期待。
 
1
0
分享到:
评论

相关推荐

    [NET 4.0面向对象编程漫谈 基础篇].金旭亮--高清版.pdf

    在.NET 4.0面向对象编程漫谈基础篇中,金旭亮详细介绍了.NET框架下的面向对象编程的基础知识和技巧。面向对象编程(Object-Oriented Programming,OOP)是一种编程范式,它使用“对象”来设计软件。对象可以包含数据...

    [NET 4.0面向对象编程漫谈 应用篇].金旭亮---高清版.pdf

    封装是隐藏对象的内部状态和实现细节,只暴露对外的操作接口,这有利于保护对象内部数据,防止外部操作的随意性。 多态是面向对象编程的一个重要特性,它允许同一操作作用于不同的对象上,可以产生不同的效果。多态...

    漫谈兼容内核.zip

    漫谈兼容内核之一:ReactOS怎样实现系统调用 漫谈兼容内核之二:关于kernel-win32的对象管理 漫谈兼容内核之三:Kernel-win32的文件操作 漫谈兼容内核之四:Kernel-win32的进程管理 漫谈兼容内核之五:Kernel-win32...

    数据库设计漫谈-多年的经验总结

    ### 数据库设计漫谈——多年的经验总结 #### 一、什么是数据库 在开始讨论数据库设计之前,首先要明确“什么是数据库”。通常来说,数据库是指一种组织化的数据集合,这些数据通过特定的方式进行存储、管理和访问...

    漫谈电子商务解决方案(ppt-34页).ppt

    - **协调知识与信息**:IBM提供信息运用、企业重组、资源管理和组织效率四个方面的解决方案,如DB2数据库、Tivoli资源管理工具等。 【IBM的CRM解决方案】 IBM的客户关系管理(CRM)解决方案包括接入管理、关系...

    数据库系统设计漫谈童家旺.ppt

    在数据库中实现ACID,通常会用到Write-Ahead Log(预写日志)、Redo和Undo操作,以及事务槽和系统变更统一时间戳(SCN)来跟踪和恢复事务状态。原子性的实现可以通过事务槽作为变更的单一入口;一致性则通过锁机制和...

    数据库系统设计漫谈.ppt

    首先,数据库基本问题的调查引出了各种类型的数据库系统,包括传统的Oracle、DB2、SQL Server、MySQL和PostgreSQL,以及分布式数据库如Google Spanner、BigTable、MegaStore、OceanBase和Hbase,还有缓存服务器和Key...

    「端点安全」跨越攻防的壁垒_漫谈企业内部安全蓝军建设实践 - 安全方案.zip

    「端点安全」跨越攻防的壁垒_漫谈企业内部安全蓝军建设实践 - 安全方案 企业安全 企业安全 NGFW 安全对抗 端点安全

    星际旅行漫谈-光速旅行-时间机器-虫洞

    综上所述,《星际旅行漫谈》通过对光速旅行、时间机器和虫洞等概念的深入探讨,不仅呈现了人类探索宇宙的梦想与追求,也为读者展现了科学技术进步所带来的无限可能。尽管目前这些概念大多停留在理论阶段,但随着科学...

    从Google Spanner漫谈分布式存储与数据库技术.pdf

    #资源达人分享计划#

    漫谈电子商务竞争优势(ppt-41页).ppt

    例如,沃尔玛通过与供应商建立战略联盟,实现了资源共享和高效采购。此外,无库存生产是电子商务的另一大优势,通过即时配送和订单生产,企业能大幅减少库存成本,如戴尔公司就实现了从订单到生产的无缝对接。 再者...

    信息安全漫谈-技术普及培训-PPT-2016

    本文件提供信息安全基本知识,面向普通人群尤其是IT技术人员,通过案例和深入浅出的讲解,让听者掌握基本的信息安全知识、理念、理论和技能。适合于各类科技公司、院校和研究院所。

    漫谈电子商务的影响(ppt-39页).ppt

    利用先进的信息技术,企业能够优化业务流程,实现资源的高效配置,从而达到降低运营成本和提高服务质量的目的。电子商务时代的到来,还推动了企业组织结构的扁平化,减少了管理层级,使得决策过程更为迅速和灵活。...

    漫谈WebLogic-CVE-2020-25511

    漫谈WebLogic-CVE-2020-25511

    步步为营C#技术漫谈七、事务处理(Transaction)[借鉴].pdf

    数据库系统通过不同的事务隔离级别(如读未提交、读已提交、可重复读和串行化)来实现这一点。 4. 持久性(Durability): 持久性意味着一旦事务提交,其结果就会永久保存,即使系统出现故障也能恢复。这通常通过日志...

    尿素期货上市漫谈-0715-中银国际期货-16页.pdf

    尿素期货的上市对于市场参与者来说,提供了一种对冲价格风险和进行风险管理的工具,同时也增加了市场的流动性和透明度。尿素期货合约在郑州商品交易所上市,预计交割区域涵盖山东、河南、江苏、河北、安徽五省,无...

    漫谈 VoIP 网络中的核心设备-SBC

    根据 Infonetics 研究报告指出,托管式 IPPBX 和融合通信市场将以每年至少 20%的增长。 由此不难看出,2016 年 SBC 市场将以大幅度增长。统计数据表明用户需求数量的增加必然 带动厂家设备的销售额。SBC 将是一个...

    数据库设计漫谈(第2版)2011

    ### 数据库设计漫谈(第2版)2011 #### 1. 数据库基础知识 **1.1 数据库的定义** 数据库是指通过特定方式组织起来并存储于计算机中的大量数据集合。这些数据能够被迅速地检索、更新以及扩展。数据库不仅仅包括...

Global site tag (gtag.js) - Google Analytics