Oracle 10G的Data Pump (Part I)
作者: Fenng
出处: Http://www.DBAnotes.net
Oracle 10G的Data Pump技术能够在不同数据库间高速的移动数据库和元数据. 这个技术的基础是两个数据移动工
具:Data Pump Export和Data Pump Import.
Oracle的Data Pump是通过一个PL/SQL包来实现的:DBMS_DataPump(也叫Data Pump API).Data Pump使用
直接路径装载和外部表机制进行数据的移动. Data Pump使用DBMS_METADATA PL/Sql包进行包括ETL过程在内的
所有的数据库对象操作.
Data Pump 是Oracle一些其它关键特性(如基于流的复制、逻辑Standby等)的基础。
Data Pump特性是集成到Oracle数据库10G中的,但是标准版本10G并行度只有1.
关键概念
Master Table
Master Table(MT)是Data Pump技术的核心.Master Table 用来保存整个过程中的细节信息(也可以说是一些
元数据信息).有了MT,导出或者导入的重启动才变为可能.这些细节信息包括:
-
产生Job状态的报告
-
重新启动Job
- 定位在Dump文件中的所有的对象.
主表在进行当前导出或者导入的操作的用户模式中被创建.该用户必须要有足够空间. 主表的名字和创建它的Job名字相
同.这也就是说,你不能显式的指定一个和现有的表或者视图重名的Data Pump Job.
导出的时候,主表被创建,并在完成的时候写到Dump文件中.在启动导入的时候,主表从Dump文件集中载入到数据库中,
并用来控制操作的顺序.主表也可以用一些参数来进行初始化操作.要注意的是主表不能跨文件存储.所以,指定的Dump
文件的大小至少要能够容纳得下MT.
主表依如下情况或被保留或者删除:
-
Job成功完成,MT被删除.
-
如果Job是使用STOP_JOB交互命令停掉的,MT将被保留以用来重启动Job.
-
如果Job是使用KILL_JOB交互命令Kill掉的,MT将被删除,并且Job不能重新启动.
- 如果Job意外中止,MT总是被保留.
Master Process 主进程
每一个导出或者导入的Job都会产生一个主进程. 主进程控制整个Job,包括和客户端通信,创建并控制worker 进程,
并进行日志操作.
Worker Process
Worker Process 是并行化进行实际的卸载与装载元数据和表数据的进程.进程的数量和PARALLEL指定的数值相等
.在整个Job过程中,该数量可以进行调整.我们在前面已经提及,标准版下并行度为1.
网络导出和导入
当你通过网络运行Import操作,源是另一个系统,不是一个Dump的文件集.
基于服务器的处理方式
和原来的Export/Import方式不同的是,Data Pump的导出和导入基本是在服务器.这意味着:
-
因为文件的读和写大部分都是在服务器端,所以路径的规范和数据库目录对象的解析都是针对服务器而不是客户
端
-
因为对文件的访问是在操作系统模式下,可能会存在数据安全问题.
- 如果使用默认的目录信息,可能会产生文件冲突问题.
Dump、Log和SQL文件的默认位置
Dump、Log和SQL文件的默认位置基于服务器的。在你运行Data Pump Export或者Data Pump Import的时候 ,
必须由DBA或者是有 CREATE ANY DIRECTORY 权限的用户创建一个目录对象.在该对象创建之后,你需要对其他用户
授权 READ/WRITE对象操作权限.
GRANT READ ON DIRECTORY data_pump_dir TO foo;
注意该目录只有在数据库服务器具有读取权限的时候才可以.
Data Pump根据如下的顺序决定文件的位置:
1. 对该文件指定的目录对象;
2. 如果对一个文件没有指定目录对象,那么将默认使用初始化参数中的DIRECTORY指定的对象.
特权用户和非特权用户
Data Pump识别两类的用户:特权(Privileged)用户和非特权(Nonprivileged)的用户.
Privileged用户具有EXP_FULL_DATABASE 和IMP_FULL_DATABASE权限. 非特权用户不具备这些权限.
特权用户可以作如下工作:
-
导出导入其他用户拥有的数据库对象.
-
导出导入非基于模式的对象(比如表空间和模式定义等内容).
- 对其他用户启动的Job进行一些操作.
Data Pump如何访问数据?
直接路径(Direct Path ,DP)和外部表(External Tables ,ET).ET模式下使用ORACLE_DATAPUMP驱动并使用直接
路径API内部数据流格式.Oracle称Data Pump会自动选择最快的方法.
文件分配
Data Pump Job管理三种类型的文件:
-
Dump文件
-
Log文件 记录一个操作的相关信息
-
SQL文件 记录一个SQL_FILE操作输出的记录
指定文件和额外的附件文件
对于导出操作,你可以指定 Dump文件,随着操作的进行你发现文件空间有些不够,你可以使用交互模式下的 ADD_FILE
命令添加额外的文件.对于导入的操作.所有的dump文件必须在Job定义的时候指定. Log文件和SQL文件将覆盖存在的
文件.Dump文件从不覆盖已经存在的文件.
设定并行度
对于导出和导入 ,并行度的设定(通过 PARALLEL 参数指定)应该低于或者等于Dump文件的个数.如果文件个数不足,性
能可能会降低(多线程同时访问一个Dump文件).前面已经提及,标准版本10G并行度只有1,所以,这个参数实际上对企业
版的10G才是有效的.
使用替代变量
在导出和导入操作中,可以使用%U替代变量来匹配文件名字,这样在一定情况下便捷了许多.
Data Pump中的Export和Import的新的特性
相对于旧有的exp/imp,Data Pump中的Export和Import有很多新的特性,包括:
1 Data Pump Job执行到一半的时候指定最大线程数的能力.
2 Data Pump job是完全能重新启动的.
3 从长时间运行的Job分离或者是重新附加上去而不会对Job本身有影响.
4 支持通过网络的导出导入操作.
5 Remap_datafile.
6 支持完美粒度对象选择.
7 支持对Job的交互命令行模式监控和交互.
8 对待导入的对象的空间评估.
9 具备指定数据库版本对象移动能力.
未完待续
附MT结构描述
SQL> desc SYS_EXPORT_SCHEMA_01
名称 是否为空? 类型
----------------------------------------- -------- -------------------
PROCESS_ORDER NUMBER
DUPLICATE NUMBER
DUMP_FILEID NUMBER
DUMP_POSITION NUMBER
DUMP_LENGTH NUMBER
DUMP_ALLOCATION NUMBER
COMPLETED_ROWS NUMBER
ERROR_COUNT NUMBER
ELAPSED_TIME NUMBER
OBJECT_TYPE_PATH VARCHAR2(200)
OBJECT_PATH_SEQNO NUMBER
OBJECT_TYPE VARCHAR2(30)
IN_PROGRESS CHAR(1)
OBJECT_NAME VARCHAR2(500)
OBJECT_SCHEMA VARCHAR2(30)
PARTITION_NAME VARCHAR2(30)
FLAGS NUMBER
COMPLETION_TIME DATE
OBJECT_TABLESPACE VARCHAR2(30)
SIZE_ESTIMATE NUMBER
OBJECT_ROW NUMBER
PROCESSING_STATE CHAR(1)
PROCESSING_STATUS CHAR(1)
BASE_OBJECT_TYPE VARCHAR2(30)
BASE_OBJECT_NAME VARCHAR2(30)
BASE_OBJECT_SCHEMA VARCHAR2(30)
PARALLELIZATION NUMBER
UNLOAD_METHOD NUMBER
GRANULES NUMBER
SCN NUMBER
DOMAIN_INDEX VARCHAR2(30)
DOMAIN_INDEX_SCHEMA VARCHAR2(30)
GRANTOR VARCHAR2(30)
NAME VARCHAR2(30)
VALUE_T VARCHAR2(4000)
VALUE_N NUMBER
IS_DEFAULT NUMBER
FILE_TYPE NUMBER
USER_DIRECTORY VARCHAR2(4000)
USER_FILE_NAME VARCHAR2(4000)
FILE_NAME VARCHAR2(4000)
EXTEND_SIZE NUMBER
FILE_MAX_SIZE NUMBER
EXTEND_ACTIVE NUMBER
OVERFLOW_TO NUMBER
PROCESS_NAME VARCHAR2(30)
LAST_UPDATE DATE
WORK_ITEM VARCHAR2(30)
NON_TRANSACTIONAL CHAR(1)
OBJECT_NUMBER NUMBER
COMPLETED_BYTES NUMBER
TOTAL_BYTES NUMBER
METADATA_IO NUMBER
DATA_IO NUMBER
CUMULATIVE_TIME NUMBER
OLD_VALUE VARCHAR2(4000)
SEED NUMBER
LAST_FILE NUMBER
USER_NAME VARCHAR2(30)
OPERATION VARCHAR2(30)
JOB_MODE VARCHAR2(30)
VERSION NUMBER
DB_VERSION VARCHAR2(30)
STATE VARCHAR2(30)
PHASE NUMBER
GUID RAW(16)
START_TIME DATE
BLOCK_SIZE NUMBER
METADATA_BUFFER_SIZE NUMBER
DATA_BUFFER_SIZE NUMBER
DEGREE NUMBER
LANGUAGE VARCHAR2(30)
PLATFORM VARCHAR2(100)
ABORT_STEP NUMBER
INSTANCE VARCHAR2(16)
参考文档
1.Oracle10i Database Utilities
2.Data Pump in Oracle Database 10g From OTN
原文出处:
<a href="http://www.dbanotes.net/Oracle/10G-Data-Pump-PartI.htm">http://www.dbanotes.net/Oracle/10G-Data-Pump-PartI.htm</a>
分享到:
相关推荐
第1章 Oracle Database 10g体系结构 第2章 安装Oracle Database 10g和创建数据库 第3章 升级到Oracle Database 10g 第4章 规划Oracle应用程序——方法、风险和标准 第Ⅱ部分 SQL和SQL*Plus 第5章 SQL中的基本语法 第...
使用Oracle Recovery Manager、Oracle Data Pump Export和Oracle Data Pump Import备份和恢复表、表空间和数据库 使用网络数据库、数据仓库和VLDB 使用最新的Oracle Database 11g工具——Oracle Total Recall...
使用SQL*oader乘10racle Data Pump导入和导出数据 使用SQL重放、变更管理和缓存结果 使用闪回和自动撤消管理功能避免人为错误 构建和调整PL/SQL触发器、函数和程序包 使用Java、JDBC和XMIL开发数据库应用程序 使用...
使用Oracle Recovery Manager、Oracle Data Pump Export和Oracle Data Pump Import备份和恢复表、表空间和数据库 使用网络数据库、数据仓库和VLDB 使用最新的Oracle Database 11g工具——Oracle Total Recall...
使用SQL*oader乘10racle Data Pump导入和导出数据 使用SQL重放、变更管理和缓存结果 使用闪回和自动撤消管理功能避免人为错误 构建和调整PL/SQL触发器、函数和程序包 使用Java、JDBC和XMIL开发数据库应用程序 ...
使用SQL*oader乘10racle Data Pump导入和导出数据 使用SQL重放、变更管理和缓存结果 使用闪回和自动撤消管理功能避免人为错误 构建和调整PL/SQL触发器、函数和程序包 使用Java、JDBC和XMIL开发数据库应用...
第24章 使用data pump export 和data pump import 第25章 访问远程数据 第26章 使用物化视图 第27章 使用oracle text 进行文本搜索 第28章 使用外部表 第29章 使用闪回查询 第30章 闪回:表和数据库 ...
第24章 使用data pump export 和data pump import 第25章 访问远程数据 第26章 使用物化视图 第27章 使用oracle text 进行文本搜索 第28章 使用外部表 第29章 使用闪回查询 第30章 闪回:表和数据库 ...
第24章 使用data pump export 和data pump import 第25章 访问远程数据 第26章 使用物化视图 第27章 使用oracle text 进行文本搜索 第28章 使用外部表 第29章 使用闪回查询 第30章 闪回:表和数据库 ...
使用SQL*oader乘10racle Data Pump导入和导出数据 使用SQL重放、变更管理和缓存结果 使用闪回和自动撤消管理功能避免人为错误 构建和调整PL/SQL触发器、函数和程序包 使用Java、JDBC和XMIL开发数据库应用...
8. **数据泵(Data Pump)**:取代了早期的Export/Import工具,Data Pump提供了更快的数据迁移速度和更灵活的数据导出导入选项。 9. **SQL优化改进**:9i引入了新的优化器策略,如成本基础优化器(Cost-Based ...
7. **导入和导出**:9iR2_DBAII_L13-18 导入和导出.ppt涵盖了Oracle的Data Pump工具,这是用于迁移数据和备份数据的主要手段,可能包括了数据泵导入(impdp)和导出(expdp)的使用方法,以及如何处理不同环境之间的...
7. **Data Pump导出导入**:Oracle Data Pump是高性能的数据迁移工具,可用于逻辑备份,将数据导出到文件,然后在需要时导入。 8. **介质恢复**:当物理文件损坏时,可以通过备份和归档日志来恢复数据。介质恢复...
4. **备份与恢复策略**:讨论Oracle的备份工具和策略,如RMAN(Recovery Manager)和Data Pump,以及如何为SAP环境设计有效的备份计划,确保数据安全和快速恢复。 5. **高可用性与灾难恢复**:介绍Oracle的高可用性...
Data Pump是Oracle的高性能数据导入导出工具,EXPDP用于导出数据库对象,IMPDP用于导入导出的数据,支持大量数据的快速迁移。 总结,Oracle备份与恢复是数据库管理的重要环节,涉及到多个层面的技术,包括RMAN、...
其中,`directory`应是在`DBMS_DATAPUMP`包中注册过的目录对象;`dumpfile`是导出数据的文件名;`logfile`是日志文件名;`TABLES`指定要导出的表名;`QUERY`则用于设定导出的条件。 例如,若要导出`sales`表中销售...
7. **优化恢复策略**:在未来的数据保护策略中,应确保定期备份,启用Archivelog模式,并考虑使用数据泵(Data Pump)导出/导入作为数据保护的一种手段。 8. **故障排查和预防**:查明造成数据块损坏的原因,可能是...
expdp username/password directory=DATA_PUMP_DIR dumpfile=full_db.dmp logfile=full_db.log full=y ``` ##### 4. **索引处理** - **问题描述**:在某些情况下,如创建局部唯一索引时,可能会遇到ORA-14039...