`

Checkpoint和SCN的解析

阅读更多

Checkpoint
很多人都把checkpoint的概念给复杂化了,其实checkpoint这个
数据库概念引入的真正意义就是用来减少在数据库恢复过程中所花的时间(instance recovery),那么checkpoint是又谁来做的呢?我们都知道数据库中有个CKPT进程,这个是个可选进程,但是真正执行检查点的任务并不是有ckpt来完成的,而是ckpt在更新控制文件和数据文件头的有关信息后,通知DBWn进程,产生一个检查点,在产生检查点的时候,DBWn进程会将buffer cache中的脏数据(当前online redo log对应的脏数据),写入我们的数据文件当中。那么这个时候如果数据库此时崩溃(比如我们做个shutdown abort),那么在进行实例恢复的时候就可以不需要当前online redo log的内容了,会很快就做完。因此ckpt进程只是个辅助进程,他的任务更多的是用来在系统做checkpoint的时候更新控制文件和数据文件头中的信息。其实在oracle 8i的时候呢,ckpt的任务一般都是由lgwr进程来完成,到了8i以后,随着CKPT进程的引入,lgwr的工作负担就减轻了很多(commit的速度加快了)
那么如何来产生检查点呢?
有三种方法,可以通过
1.alter system checkpoint
2.alter system switch logfile
3.DBWn进程写出脏块

SCN
在Oracle中理解为一个内部同步时钟,是系统改变号的缩写(system change number),在
Oracle数据库中我们可以通过dbms_flashback包来查询当前系统的改变号:select dbms_flashback.get_system_change_number from dual;一般来讲SCN主要是用来标识数据库所做的所有改变,这个SCN的改变是只能前进,不能回退,除非我们打算重建库,数据库中的SCN永远不会归0,一般来说SCN的前进触发是由commit来进行的,除了这些据我观察每隔3秒种系统也都会刷新一次SCN.

需要注意的是:
1.CKPT一定是是在checkpoint发生的时候将数据库当前的SCN更新入数据库文件头和控制文件当中,同时DBWn进程将buffer cache中的脏数据块(dirty block)写到数据文件当中(这个脏数据也一定是当前online redo log保护的那一部分)。

2.同时CKPT进程还会在控制文件当中记录(redo block address)RBA,这个地址用来标志恢复的时候需要从日志中的那个位置开始。

 

在Oracle数据库中和checkpoint相关的SCN总共有4个
1.System checkpoint SCN  (存在于控制文件)
在系统执行checkpoint后,Oracle会更新当前控制文件中的System checkpoint SCN。
我们可以通过
select checkpoint_change# from v$database:
来查看

2.Datafile checkpoint SCN (存在于控制文件)
由于控制文件中记录了Oracle中各个数据库文件的位置和信息,其中当然也包括了Datafile checkpoint SCN,因此在执行checkpoint的时候,Oracle还会去更新控制文件中所记录的各个数据文件的datafile checkpoint SCN.
我们可以通过
select checkpoint_change#  from v$datafile;
来查看

3.Start SCN (存在于各个数据文件头)
在执行checkpoint时,Oracle会更新存放在各个实际的数据文件头的Start SCN(注意绝对不会是控制文件中),这个SCN存在的目的是用于检查数据库启动过程中是否需要做media recovery(介质恢复)
我们可以通过
select checkpoint_change# from v$datafile_header;

4.End SCN(存在于控制文件)
最后一类SCN,End SCN他也是记录在控制文件当中,每一个所记录的数据文件头都有一个对应的End SCN,这个End SCN一定是存在于控制文件当中。这个SCN存在的绝对意义主要是用来去验证数据库启动过程中是否需要做instance recovery。我们可以通过
select name,last_change# from v$datafile
那么其实在数据库正常运行的情况下,对于read/write的online 数据文件这个SCN号为#FFFFFF(NULL).

下面来聊一聊SCN号于数据库的启动

1.在数据库的启动过程中,当System Checkpoint SCN=Datafile Checkpoint SCN=Start SCN的时候,Oracle数据库是可以正常启动的,而不需要做任何的media recovery。而如果三者当中有一个不同的话,则需要做media recovery

2.那什么时候需要做instance recovery呢?其实在正常open数据库的时候,oracle会将记录在控制文件中的每一个数据文件头的End SCN都设置为#FFFFFF(NULL),那么如果数据库进行了正常关闭比如(shutdown or shutdown immediate)这个时候,系统会执行一个检查点,这个检查点会将控制文件中记录的各个数据文件头的End SCN更新为当前online数据文件的各个数据文件头的Start SCN,也就是End SCN=Start SCN,如果再次启动数据库的时候发现二者相等,则直接打开数据库,并再次将End SCN设置为#FFFFFF(NULL),那么如果数据库是异常关闭,那么checkpoint就不会执行,因此再次打开数据库的时候End SCN<>Start SCN这个时候就需要做实例恢复。

说了那么多更新SCN操作什么的,这个更新操作到底是由谁做的呢?其实刚才已经说过了,就是我们的CKPT进程,他不仅仅会更新SCN,而且还会通知DBWn做他的事情。

再说一下System Checkpoint SCN和Datafile Checkpoint SCN,这两个SCN都是记录在控制文件当中的。但是这两个SCN有什么作用呢?
logzgh有段论述,我自己的想了一下,还是学习一下他的结论:

1.对只读表空间,其数据文件的Datafile Checkpoint SCN、Start SCN和END SCN号均相同。这三个SCN在表空间处于只读期间都将被冻结。

2.如果控制文件不是当前的控制文件(其实就是说,想比当前redo log的SCN来讲,控制文件已经过时了),则System checkpoint SCN会小于Start SCN(Start SCN是来自实际的数据文件头,有比较依据)。记录这些SCN号,可以区分控制文件是否是当前的控制文件。当有一个Start SCN(从当前各个在线数据文件中获得)号超过了System Checkpoit SCN号时,则说明控制文件不是当前的控制文件,因此在做recovery时需要采用using backup controlfile。这是为什么需要记录SystemCheckpoint SCN的原因之一。

当我们重建控制文件的时候,重建方式分两种(resetlogs 和 noresetlogs)

1.使用resetlogs选项时,System Checkpoint SCN为被归为0,而其中记录的各个数据文件的Datafile Checkpoint SCN则来自于Start SCN(也就是说可能会从冷备份的数据文件的数据文件头中获取)。根据上述的描述,此时需要采用using backup controlfile做recovery. 因此情况是 System Checkpoint SCN=0 < Start SCN = Datafile Checkpoint SCN

2.使用noresetlogs选项时,有一个前提就是:一定要有online redo log的存在。否则就要使用resetlogs选项。这个时候控制文件重建好时,其system checkpoint SCN=Datafile Checkpoint SCN=Lastest Checkpoint SCN in online redo log,我们可以看到Datafile Checkpoint SCN并没有从Start SCN中读取。而是读取了最新的日志文件中的SCN作为自己的数据。此时重建的控制文件
在恢复中的作用跟最新的控制文件类似,System Checkpoint SCN(已经读取最新的redo log的checkpoint SCN信息)可能会>Start SCN (因为数据文件可能会从冷备份中恢复),恢复时就不需要加using backup controlfile子句了

关于backup controlfile的补充:backup controlfile只有备份时刻的archive log信息,并没有DB crash时刻的archive log信息,所以并不会自动应用online redo log,而是提示找不到序号为Lastest Archive log sequence + 1 的archive log,尽管你可以手动指定online redo log来实现完全恢复,但因为一旦使用了using backup controlfile子句,Oracle就视为不完全恢复,必须open resetlogs! 实际上,假如你有旧的控制文件又不想resetlogs,那很简单,使用旧的控制文件mount然后 backup to trace ,然后手工创建控制文件,使用 reuse database ... noresetlogs .这样就可以 recover database 自动恢复并open database 而不用 resetlogs 了

转自:http://space.itpub.net/12361284/viewspace-346

分享到:
评论

相关推荐

    Oracle SCN机制解析

    Low SCN和Next SCN用于跟踪Redo Log的记录范围,当发生日志切换或CheckPoint时,DBWn会根据这些SCN将数据写入数据文件,同时更新Control File和数据文件头中的SCN。 SCN的生成基于时间戳,每当需要新的SCN时,系统...

    oracle scn概念解析

    ### Oracle SCN 概念解析 #### 一、SCN 的定义与作用 **SCN (System Change Number)** 是 Oracle 数据库中的一个重要概念,用于记录数据库的状态变化。它本质上是一个递增的逻辑计数器,每当数据库发生变化时就会...

    Oracle SCN机制解析.docx

    如果表空间被设置为只读,那么相关数据文件的Start SCN和Datafile Checkpoint SCN不会更新。此外,可以使用`SCN_TO_TIMESTAMP`函数(10g及以上版本)将SCN转换回timestamp,以便进行时间点恢复。 总之,Oracle SCN...

    oracle scn 详解

    #### 一、SCN概念解析 **SCN (System Change Number)** 是Oracle数据库中用于标识数据库状态变化的一种内部编号机制。它是一个递增的数字,每当数据库发生更新操作时,SCN就会增加。这个机制主要用于跟踪数据库的...

    Oracle SCN与检查点详解

    不同的SCN类型有不同的作用,比如检查点SCN(Checkpoint SCN)记录了最近一次检查点操作时的数据文件状态。数据文件头中的Checkpoint SCN反映了数据文件的最新检查点信息,这对于数据库恢复至关重要。 获取SCN的...

    oracle checkpoint

    ### Oracle Checkpoint 深入解析 #### 一、引言与目标 在深入探讨 Oracle Checkpoint 的原理之前,我们先来明确一下本篇文章的主要目标和背景。 **目标:** - **理论理解:**理解 Oracle Checkpoint 的核心概念...

    Oracle 10g OCP 042解析

    Checkpoint发生时,CKPT进程会触发DBWR进程工作,确保特定系统更改编号(SCN)前的所有数据变更都已存盘。这为实例恢复提供了一个“安全点”,即恢复时只需处理Checkpoint之后的日志记录,提高了恢复效率。 - **实例...

    构建在UNIX和Oracle上的应用系统的综合优化

    在SQL优化方面,需要深入理解SQL语句的执行过程,选择合适的数据库连接机制,区分硬解析和软解析,并制定执行计划和使用hints。SQL跟踪和分析用于诊断性能问题。Oracle的锁(Lock)和闩(Latch)机制是数据库并发...

    Oracle 10g OCP 042解析(175题)

    这涉及到红日志(redolog)和检查点(checkpoint)的概念。 #### 红日志(redolog) 红日志是用来记录所有事务更改数据的序列化日志,包括未提交和已提交的事务。它是数据库恢复过程中的关键组成部分,确保了数据的一致...

    Oracle IO问题解析

    此外,控制文件还记录了系统和数据文件的SCN(System Change Number)信息,这对于数据恢复至关重要。 **1.1.2 用户数据修改** 为了提高性能,Oracle会将数据缓存在内存中的缓冲池(Buffer Cache)里。当用户数据...

    深入解析OracleDBA入门进阶与诊断案例 3/4

    深入解析OracleDBA入门进阶与诊断案例 扫描版 作 者:盖国强 著 出 版 社:人民邮电出版社 出版时间:2009-1-1 页 数:527 内容简介  针对数据库的启动和关闭、控制文件与数据库初始化、参数及参数文件、数据...

    深入解析OracleDBA入门进阶与诊断案例 2/4

    深入解析OracleDBA入门进阶与诊断案例 扫描版 作 者:盖国强 著 出 版 社:人民邮电出版社 出版时间:2009-1-1 页 数:527 内容简介  针对数据库的启动和关闭、控制文件与数据库初始化、参数及参数文件、数据...

    深入解析OracleDBA入门进阶与诊断案例 4/4

    深入解析OracleDBA入门进阶与诊断案例 扫描版 作 者:盖国强 著 出 版 社:人民邮电出版社 出版时间:2009-1-1 页 数:527 内容简介  针对数据库的启动和关闭、控制文件与数据库初始化、参数及参数文件、数据...

    Oracle与MySQL的几点区别

    在Oracle中,插入或更新字符串之前,需要将所有单引号替换为两个单引号,以避免解析错误。 4. **翻页SQL语句**: MySQL的翻页查询相对简单,可以使用LIMIT子句指定开始位置和记录数。而在Oracle中,由于没有直接的...

    实用数据库21

    - **CKPT(Checkpoint Process)**:负责执行检查点操作,将缓冲区中的数据写入磁盘,并更新控制文件和数据文件中的SCN(System Change Number)。 - **DBWR(Database Writer Process)**:负责将脏缓存块写回数据文件。 ...

    电力营销系统Oracle数据库优化研究.pdf

    检查点(checkpoint)是Oracle数据库保证数据一致性的机制,它涉及DBWR进程将脏数据块写入数据文件并更新SCN。当系统出现"checkpoint not complete"错误时,意味着检查点过程未能完成,可能影响到实例恢复。为优化此...

    oracle 相关

    此外,控制文件还记录了系统级和数据文件的SCN(System Change Number),用于数据恢复时确定数据的一致性状态。当数据文件的SCN发生变化,控制文件中的SCN也会相应更新。 ##### 2. 用户数据的写操作 Oracle为了...

    oracle结构体系组件

    - **提交**:提交事务时,LGWR进程会将重做日志记录写入重做日志文件,CKPT进程确保数据文件头和控制文件中的SCN(系统更改号)与重做日志文件中的SCN一致。 #### 五、数据库管理员的角色 数据库管理员(DBA)负责...

    Oracle架构的基础知识(入门级)

    - **共享池**:存储解析过的SQL语句和其他信息。 2. **个人全局区(PGA)**:每个用户进程都有自己的PGA,用于存储用户特定的信息。 #### 四、后台进程 Oracle数据库通过一系列后台进程来管理其内部的操作,这些...

    oracle安装 备份 linux 脚本

    本文将根据提供的《OracleDBA:Backup and Recovery Scripts》样本章节内容,详细解析Oracle数据库在Linux环境下进行冷备份、热备份以及导出操作的关键知识点。 #### 二、恢复原则 无论是在Unix还是Windows NT环境...

Global site tag (gtag.js) - Google Analytics