`

SCN专题+介质恢复+实例恢复

阅读更多

SCN专题+介质恢复+实例恢复

一,四个SCN的概念。

二,Timestamp和SCN的暧昧关系大揭秘

三,SCN如何在数据库恢复中起作用。

四,四种SCN不等的各种情况分析:

4.1、系统正常关闭:

4.2、系统异常关闭:

4.3、旧数据文件

4.4、备份控制文件

4.5、重建noresetlogs控制文件

4.6、重建resetlogs控制文件

五,事务中SCN的作用

5.2 Timestamp和SCN的暧昧关系大揭秘

六,instance recovery / crash recovery /media recovery

6.1 实例恢复:解决scn不一致问题

6.2 媒体恢复:解决数据文件、控制文件等的物理损坏问题

6.3 我的理解:

6.4 网友的理解:

七,参考文档


一、四个SCN的概念。
1、系统检查点scn

当一个检查点动作完成后,Oracle就把系统检查点的SCN存储到控制文件中。

select checkpoint_change# from v$database;

 

2,数据文件检查点scn

当一个检查点动作完成后,Oracle就把每个数据文件的scn单独存放在控制文件中。

select name,checkpoint_change# from v$datafile;

 

3,启动scn

Oracle把这个检查点的scn存储在每个数据文件的文件头中,这个值称为启动scn,因为它用于在数据库实例启动时,

检查是否需要执行数据库恢复。

select name,checkpoint_change# from v$datafile_header

 

4、终止scn

每个数据文件的终止scn都存储在控制文件中。

select name,last_change# from v$datafile

二、Timestamp和SCN的暧昧关系大揭秘


我们可以通过函数SCN_TO_TIMESTAMP(10g以后)将其转换回timestamp:

SQL> select dbms_flashback.get_system_change_number,SCN_TO_TIMESTAMP(dbms_flashback.get_system_change_number) from dual;

GET_SYSTEM_CHANGE_NUMBER     SCN_TO_TIMESTAMP(DBMS_FLASHBAC

------------------------     ----------------------------------

                  593661    31-7月 -09 05.13.28.000000000 下午

也可以用函数timestamp_to_scn将一个timestamp转换为SCN:

SQL> select timestamp_to_scn(SYSTIMESTAMP) as scn from dual;

SCN

----------

 593676

SCN除了作为反映事务数据变化并保持同步外,它还起到系统的“心跳”作用——每隔3秒左右系统会刷新一次系统SCN。


 

 

三、SCN如何在数据库恢复中起作用。


数据库在正常关闭(shutdown immediate/normal)时,会先做一次checkpoint,将log file中的数据写入数据文件中,将控制文件、数据文件中的SCN(包括控制文件中的Stop SCN)都更新为最新的SCN。

数据库异常/意外关闭不会或者只更新部分Stop SCN。

当数据库启动时,Oracle先检查控制文件中的每个Datafile Checkpoint SCN和数据文件中的Start SCN是否相同,再检查每个Datafile Checkpoint SCN和Stop SCN是否相同。如果发现有不同,就从Redo Log中找到丢失的SCN,重新写入数据文件中进行恢复。具体的数据恢复过程这里就不再赘述。

SCN作为Oracle中的一个重要机制,在多个重要功能中起着“控制器”的作用。了解SCN的产生和实现方式,帮助DBA理解和处理恢复、DG、Streams复制的问题。

最后提一句,利用SCN机制,在Oracle10g、11g中又增加了一些很实用的功能——数据库闪回、数据库负载重现等。

 

1,using backup controlfile 的真实面目

以下条件需要使用using backup controlfile

1)、使用备份控制文件

2)、重建resetlogs控制文件,如果重建立noresetlogs不必要使用using backup controlfile

 

2、alter database open resetlog 真实面目

 

指定RESETLOGS将重设当前LOG sequence number为1,抛弃所有旧日志信息。

以下条件需要使用resetlog

1)在不完全恢复(介质恢复)

2)使用备份控制文件

使用resetlogs打开数据库后务必完整地备份一次数据库

 

3、create controlfile resetlogs/noresetlogs

1).用Noresetlogs重建控制文件时,控制文件中 datafile Checkpoint来自Online logs中的Current log头

 

2).用Resetlogs重建控制文件时,控制文件中datafile Checkpoint来自各数据文件头。

 

四、四种SCN不等的各种情况分析:


当system scn,  datafile scn,  start scn 不全相等,需要介质恢复,如果stop  scn null需要实例恢复

resetlogs抛弃所有在上一次恢复没有用到的日志信息,确保不被重新用与恢复。

 

4.1、系统正常关闭:
system scn=datafile scn=start scn=stop scn

1)system scn=datafile scn=start scn,不需要介质恢复

2)stopscn not null,不需要实例恢复

 

4.2、系统异常关闭:
system scn=datafile scn=start scn,stop scn null

1)system scn=datafile scn=start scn,不需要介质恢复

2)stopscn null,需要实例恢复

 

4.3、旧数据文件
system scn=datafile scn>start scn,stop scn null/notnull

1)system scn=datafile scn>start scn,需要介质恢复成system scn=datafile scn=start scn

2)stopscn null,需要实例恢复,not null 不需要实例恢复

 

4.4、备份控制文件
system scn=datafile scn<=start scn(当数据文件为旧的相等),stop scn notnull/null

1)system scn=datafile scn<=start scn,需要使用using backup controlfile介质恢复成system scn=datafile scn=start scn=current log scn(当前日志最大SCN)

2)为保证上一次恢复没有用到log日志不被使用,必须resetlogs

 

4.5、重建noresetlogs控制文件
控制文件中 datafile Checkpoint来自Online logs中的Current log头

current log scn=system scn=datafile scn>=start scn,stop scn not null/null

1)current log scn=system scn=datafile scn>=start scn,需要介质恢复成system scn=datafile scn=start scn=redolog scn(当前日志最大SCN),stop scn not null

2)stopscn not null 不需要实例恢复

 

4.6、重建resetlogs控制文件
控制文件中datafile Checkpoint来自各数据文件头。

system scn>=datafile scn=start scn,stop scn not null/null

1)system scn>=datafile scn=start scn,需要使用using backup controlfile介质恢复成system scn=datafile scn=start scn(当前日志最大SCN),stop scn not null

2)stop notnull,因为SCN已经为redolog scn,log已经不能使用,必须resetlogs

 

五、事务中SCN的作用


SCN(System Chang Number)作为oracle中的一个重要机制,在数据恢复、Data Guard、Streams复制、RAC节点间的同步等各个功能中起着重要作用。理解SCN的运作机制,可以帮助你更加深入地了解上述功能。

 

 

 

在理解SCN之前,我们先看下oracle事务中的数据变化是如何写入数据文件的:

1、 事务开始;

 

2、 在buffer cache中找到需要的数据块,如果没有找到,则从数据文件中载入buffer cache中;

 

3、 事务修改buffer cache的数据块,该数据被标识为“脏数据”,并被写入log buffer中;

 

4、 事务提交,LGWR进程将log buffer中的“脏数据”写入redo log file中;

 

5、 当发生checkpoint,CKPT进程更新所有数据文件的文件头中的信息,DBWn进程则负责将Buffer Cache中的脏数据写入到数据文件中。

 

经过上述5个步骤,事务中的数据变化最终被写入到数据文件中。但是,一旦在上述中间环节时,数据库意外宕机了,在重新启动时如何知道哪些数据已经写入数据文件、哪些没有写呢(同样,在DG、streams中也存在类似疑问:redo log中哪些是上一次同步已经复制过的数据、哪些没有)?SCN机制就能比较完善的解决上述问题。

 

SCN是一个数字,确切的说是一个只会增加、不会减少的数字。正是它这种只会增加的特性确保了Oracle知道哪些应该被恢复、哪些应该被复制。

总共有4中SCN:系统检查点(System Checkpoint)SCN、数据文件检查点(Datafile Checkpoint)SCN、结束SCN(Stop SCN)、开始SCN(Start SCN)。其中前面3中SCN存在于控制文件中,最后一种则存在于数据文件的文件头中。

 

在控制文件中,System Checkpoint SCN是针对整个数据库全局的,因而只存在一个;而Datafile Checkpoint SCN和Stop SCN是针对每个数据文件的,因而一个数据文件就对应在控制文件中存在一份Datafile Checkpoint SCN和Stop SCN。在数据库正常运行期间,Stop SCN(通过视图v$datafile的字段last_change#可以查询)是一个无穷大的数字或者说是NULL。

 

在一个事务提交后(上述第四个步骤),会在redo log中存在一条redo记录,同时,系统为其提供一个最新的SCN(通过函数dbms_flashback.get_system_change_number可以知道当前的最新SCN),记录在该条记录中。如果该条记录是在redo log被清空(日志满做切换时或发生checkpoint时,所有变化日志已经被写入数据文件中),则其SCN被记录为redo log的low SCN。以后在日志再次被清空前写入的redo记录中SCN则成为Next SCN。

 

当日志切换或发生checkpoint(上述第五个步骤)时,从Low SCN到Next SCN之间的所有redo记录的数据就被DBWn进程写入数据文件中,而CKPT进程则将所有数据文件(无论redo log中的数据是否影响到该数据文件)的文件头上记录的Start SCN(通过视图v$datafile_header的字段checkpoint_change#可以查询)更新为Next SCN,同时将控制文件中的System Checkpoint SCN(通过视图v$database的字段checkpoint_change#可以查询)、每个数据文件对应的Datafile Checkpoint(通过视图v$datafile的字段checkpoint_change#可以查询)也更新为Next SCN。但是,如果该数据文件所在的表空间被设置为read-only时,数据文件的Start SCN和控制文件中Datafile Checkpoint SCN都不会被更新。

 

那系统是如何产生一个最新的SCN的?实际上,这个数字是由当时的timestamp转换过来的。

 

每当需要产生一个最新的SCN到redo记录时,系统获取当时的timestamp,将其转换为数字作为SCN。

 

5.2 Timestamp和SCN的暧昧关系大揭秘


我们可以通过函数SCN_TO_TIMESTAMP(10g以后)将其转换回timestamp:

SQL> select dbms_flashback.get_system_change_number,SCN_TO_TIMESTAMP(dbms_flashback.get_system_change_number) from dual;

GET_SYSTEM_CHANGE_NUMBER     SCN_TO_TIMESTAMP(DBMS_FLASHBAC

------------------------     ----------------------------------

                  593661    31-7月 -09 05.13.28.000000000 下午

也可以用函数timestamp_to_scn将一个timestamp转换为SCN:

SQL> select timestamp_to_scn(SYSTIMESTAMP) as scn from dual;

SCN

----------

 593676

SCN除了作为反映事务数据变化并保持同步外,它还起到系统的“心跳”作用——每隔3秒左右系统会刷新一次系统SCN。

 

六、instance recovery / crash recovery /media recovery


6.1 实例恢复:解决scn不一致问题
instance recovery 或者 crash recovery

特点:    1,仅使用 online redo log files 和 current online datafiles (从来不会从archivelogs 和backup中恢复数据)

              2,数据库启动时由smon进程自动恢复

 

6.2 媒体恢复:解决数据文件、控制文件等的物理损坏问题
特点:    1,需要人工干预

              2,需restore datafile (不会使用被破坏了的在线datafile)

              3,需要archived logs 和 online logs 和 backup

 

6.3 我的理解:

当数据库启动时

system scn datafile scn start scn 不全相等,则需要介质恢复。

stop scn null 则需要实例恢复。

-----------------

Instance Recovery所需要的信息,就是最近一次checkpoint之后到日志文件结尾的这些redo信息。因为checkpoint之前的数据都已经一致性地写入到数据文件中了,而之后的数据可能有一部分已经写进数据文件,而有一部分没有写进数据文件。

Instance Recovery所需要的时间,将数据文件从最近一次checkpoint开始,恢复到控制文件中记录的这个数据文件的最后一个SCN值为止,应用这两者之间redo信息的时间就是instance recovery所要花费的时间。

6.4 网友的理解:

crash recovery就是instance recovery 
这种恢复指的是数据库不正常关闭的恢复 由数据库打开,smon进程自动做 不需要人工干预

例如数据库断电等
media recovery   指的是介质恢复
比如数据文件损坏等
而这个时候通过备份+日志文件来恢复 
restore datafile 5,
recover datafile 5,
是需要人工干预的

七,参考文档

http://www.eygle.com/archives/2005/08/eiaescnaeooeaoi.html

http://hi.baidu.com/zwfha/blog/item/1eac09d1047d613b9b5027c6.html   实例恢复! 理解scn

http://www.diybl.com/course/7_databases/oracle/oraclejs/2008224/101040.html

http://www.diybl.com/course/7_databases/oracle/oraclejs/2008224/101040.html

http://blog.163.com/jianmei8486@126/blog/static/18858382200810411715787/

 

分享到:
评论

相关推荐

    scn号与恢复研究.pdf

    4. **EndSCN号**:此SCN存储在控制文件中,用于判断是否需要进行实例恢复。可以通过以下SQL查询获取: ```sql SELECT name, last_change# FROM v$datafile; ``` 在数据库正常运行时,对于在线且可读写的数据文件...

    oracle介质恢复的内部过程

    1. **Start SCN (System Change Number)**:这是介质恢复开始时所依据的系统更改编号,通常是从数据文件头部选取的最小checkpoint SCN值。 2. **Checkpoint SCN**:每次checkpoint操作会记录一个SCN,用于标识数据库...

    断档恢复-基于scn 号恢复.pdf

    【断档恢复-基于SCN号恢复】 在Oracle数据库环境中,数据保护是非常关键的一环,尤其是在采用Data Guard(DG)架构的系统中。Data Guard提供了一种高可用性和灾难恢复解决方案,通过创建一个备用数据库(standby ...

    BLOG_Oracle_lhr_Oracle SCN的一点研究.pdf

    实例恢复和介质恢复的区别,以及RAC中的实例恢复概念也是与SCN密切相关的重要知识点。实例恢复指的是数据库实例在崩溃后自我恢复的过程,而介质恢复则涉及到介质故障导致的数据文件损坏的恢复。在RAC(Real ...

    oracle patch scn--修改oracle scn工具(oracle异常恢复利器)

    oracle scn修改工具,可以直接修改oracle scn,在极端情况下恢复使用,比如解决ORA-600 2662等类似错误,使用说明:https://www.xifenfei.com/2022/06/win-oracle-scn-patch.html

    oracle 备份&恢复案例.doc

    本案例主要探讨了Oracle数据库的实例恢复和介质恢复,以及不同类型的不完全恢复。 首先,我们来看一下实例恢复。实例恢复主要针对的是由于系统故障、进程异常等原因导致数据库实例非正常关闭的情况。在这种情况下,...

    oracle备份与恢复案例电子书

    总结来说,Oracle备份与恢复是数据库管理中的核心技能,涉及到实例恢复、介质恢复、不同类型的不完全恢复策略,以及使用如`exp`和`imp`等工具进行数据迁移。了解并熟练掌握这些概念和技术,能够帮助DBA有效地应对...

    Oracle备份与恢复案例

    本案例将探讨Oracle数据库的实例恢复和介质恢复两种主要的恢复类型。 实例恢复主要针对的是由于系统异常或人为操作导致的数据库实例突然终止的情况。例如,电源故障、后台进程崩溃或者执行了SHUTDOWN ABORT命令。在...

    oracle scn 详解

    如果不一致,则可能需要进行实例恢复。 - **SCN不一致的情况**: - 如果`SYSTEM SCN &gt; DATAFILE SCN`,表明正在使用较旧的备份数据文件,这时需要进行介质恢复。 - 如果`SYSTEM SCN &lt; DATAFILE SCN`,意味着使用...

    Oracle SCN机制解析

    SCN是一个不断递增的数字,确保了数据库能够准确地识别和处理事务中的数据修改,尤其是在故障恢复、Data Guard、Streams复制以及RAC集群节点间的同步等场景下。 在Oracle数据库的事务处理流程中,SCN起着至关重要的...

    个人经验总结:Oracle数据库SCN号详解

    启动SCN是指Oracle在数据库实例启动时用来确定是否需要执行数据库恢复操作的SCN值。这个SCN值存储在每个数据文件的文件头中,用于与控制文件中的数据文件检查点SCN进行对比,以判断数据库是否需要恢复。 **查询示例...

    ORACLE中数据库的恢复策略.pdf

    当需要进行实例恢复或介质恢复时,系统会比较控制文件、数据文件和重做日志中的SCN,以确定恢复类型和所需的归档日志及重做日志。 此外,回滚段(Rollback Segments)是存储事务回滚信息的地方,用于撤销未提交的事务...

    oracle SCN 祥解

    1. **数据恢复**:在数据库恢复过程中,SCN用于确定哪些重做日志条目需要应用到数据文件上,以恢复数据的一致性状态。 2. **快照控制**:SCN被用于控制数据快照的一致性,确保用户查询的是数据的一致视图。 3. **...

    SCN号的闪回

    "SCN号的闪回"是Oracle数据库中一个重要的恢复机制,全称为System Change Number,它是Oracle数据库中记录事务更改的唯一序列号。SCN是一个不断增加的数字,每次数据库中的数据发生变化时,都会生成一个新的SCN,...

    Orcle数据保存与恢复.doc

    总结起来,Oracle 数据库的保存与恢复是一个涉及多个层面的过程,包括预防性备份、实例恢复和介质恢复策略。DBA 必须熟悉这些概念,以便在故障发生时迅速有效地恢复数据库,确保业务连续性和数据完整性。同时,定期...

    oracle scn

    SCN对于数据库的正常运行至关重要,尤其是在恢复操作中扮演着关键角色。 SCN的工作原理是这样的:每当数据库中的事务进行修改或插入数据时,Oracle首先会为该事务分配一个唯一的SCN,并将其写入回滚段。然后,日志...

Global site tag (gtag.js) - Google Analytics