`

Spool和SQLLDR--Oracle数据导出导入(传)

阅读更多

对于SPOOL数据的SQL,最好要自己定义格式,以方便程序直接导入,SQL语句如:
select taskindex||'|'||commonindex||'|'||tasktype||'|'||to_number(to_char(sysdate,'YYYYMMDD')) from ssrv_sendsms_task;

spool常用的设置
set colsep' ';    //域输出分隔符
set echo off;    //显示start启动的脚本中的每个sql命令,缺省为on
set feedback off;  //回显本次sql命令处理的记录条数,缺省为on
set heading off;   //输出域标题,缺省为on
set pagesize 0;   //输出每页行数,缺省为24,为了避免分页,可设定为0。
set termout off;   //显示脚本中的命令的执行结果,缺省为on
set trimout on;   //去除标准输出每行的拖尾空格,缺省为off
set trimspool on;  //去除重定向(spool)输出每行的拖尾空格,缺省为off

导出文本数据的建议格式:
SQL*PLUS环境设置SET NEWPAGE NONE
SET HEADING OFF
SET SPACE 0
SET PAGESIZE 0
SET TRIMOUT ON
SET TRIMSPOOL ON
SET LINESIZE 2500

注:LINESIZE要稍微设置大些,免得数据被截断,它应和相应的TRIMSPOOL结合使用防止导出的文本有太多的尾部空格。但是如果 LINESIZE设置太大,会大大降低导出的速度,另外在WINDOWS下导出最好不要用PLSQL导出,速度比较慢,直接用COMMEND下的 SQLPLUS命令最小化窗口执行。

对于字段内包含很多回车换行符的应该给与过滤,形成比较规矩的文本文件。通常情况下,我们使用SPOOL方法,将数据库中的表导出为文本文件的时候会采用 两种方法,如下述:

方法一:采用以下格式脚本 
set colsep '|' --设置|为列分隔符
  set trimspool on
  set linesize 120
  set pagesize 2000
  set newpage 1
  set heading off
  set term off
set num 18
set feedback off
  spool 路径+文件名
  select * from tablename;
  spool off

方法二:采用以下脚本
set trimspool on
  set linesize 120
  set pagesize 2000
  set newpage 1
  set heading off
  set term off
  spool 路径+文件名
  select col1||','||col2||','||col3||','||col4||'..' from tablename;
  spool off

比较以上方法,即方法一采用设定分隔符然后由sqlplus自己使用设定的分隔符对字段进行分割,方法二将分隔符拼接在SELECT语句中,即手工控制输 出格式。

在实践中,发现通过方法一导出来的数据具有很大的不确定性,这种方法导出来的数据再由sqlldr导入的时候出错的可能性在95%以上,尤其对大批量的数 据表,如100万条记录的表更是如此,而且导出的数据文件狂大。

而方法二导出的数据文件格式很规整,数据文件的大小可能是方法一的1/4左右。经这种方法导出来的数据文件再由sqlldr导入时,出错的可能性很小,基 本都可以导入成功。

因此,实践中我建议大家使用方法二手工去控制spool文件的格式,这样可以减小出错的可能性,避免走很多弯路。


自测例:将ssrv_sendsms_task表中的数据导出到文本(数据库Oracle 9i 操作系统 SUSE LINUX Enterprise Server 9)

spool_test.sh脚本如下:
#!/bin/sh
DB_USER=zxdbm_ismp #DB USER
DB_PWD=zxin_smap #DB PASSWORD
DB_SERV=zx10_40_43_133 #DB SERVICE NAME

sqlplus -s $DB_USER/$DB_PWD@$DB_SERV<<EOF # -s 参数屏蔽打印到屏幕上的其他信息,只显示sql执行后从DB中查询出来的信息,过滤掉spool函数执行时在文件中写入的其他信息。
set trimspool on
set linesize 120
set pagesize 2000
set newpage 1
set heading off
set term off
spool promt.txt
select taskindex||'|'||commonindex||'|'||tasktype||'|'||to_number(to_char(sysdate,'YYYYMMDD')) from ssrv_sendsms_task;
spool off
EOF


执行./spool_test.sh后生成sp_test.txt,内容如下:
83|115|1|20080307
85|115|11|20080307
86|115|10|20080307
84|115|2|20080307
6|5|14|20080307
7|5|12|20080307
9|5|15|20080307


注:上面自测例中,spool promt.txt中的目标生成文件promt.txt,在HP-UNX环境下的shell脚本中调用Oracle的spool函数,如果将上述逻辑代码 封装为一个function,然后来调用这个function的话,则在shell脚本中最终是不会生成promt.txt文件的。只能直接执行逻辑代 码,封装后则spool函数失效。
对于promt.txt在相对路径下,下面2中方法在shell环境中执行时,两者只能择一,两者并存则spool函数会失效。假设promt.txt文 件生成的路径为:/home/zxin10/zhuo/batchoperate/spoolfile
方式[1]
echo "start spool in shell.."

sqlplus -s zxdbm_ismp/zxin_smap<<EOF
set pagesize 0
set echo off feed off term off heading off trims off
set colsep '|'
set trimspool on
set linesize 10000
set trimspool on
set linesize 120
set newpage 1
spool /home/zxin10/zhuo/batchoperate/spoolfile/promt.txt
select batchindex||'|'||productid||'|'||contentid||'|'||optype||'|'||uploadfile from zxdbm_700.s700_batch_operation where status=1;
spool off
EOF
echo "end.."
方式[2]
echo "start spool in shell.."
cd /home/zxin10/zhuo/batchoperate/spoolfile
sqlplus -s zxdbm_ismp/zxin_smap<<EOF
set pagesize 0
set echo off feed off term off heading off trims off
set colsep '|'
set trimspool on
set linesize 10000
set trimspool on
set linesize 120
set newpage 1
spool promt.txt
select batchindex||'|'||productid||'|'||contentid||'|'||optype||'|'||uploadfile from zxdbm_700.s700_batch_operation where status=1;
spool off
EOF
echo "end.."

 

 

文本如何导入oracle(sqlldr 的用法)
关键词: 文本 导入 oracle
在命令提示符中输入sqlldr userid=system/manager control='c:\control.ctl',control.clt中的内容是:
load data
infile '要导入的文本文件名'
append into table 表名
fields terminated by ' '
(字段名,字段名,字段名......)
在导入之前必须保证表已经建好
   sqlldr userid=lgone/tiger control=a.ctl
  LOAD DATA
  INFILE 't.dat' // 要导入的文件
  // INFILE 'tt.date' // 导入多个文件
  // INFILE * // 要导入的内容就在control文件里 下面的BEGINDATA后面就是导入的内容
  
  INTO TABLE table_name // 指定装入的表
  BADFILE 'c:\bad.txt' // 指定坏文件地址
  
   ************* 以下是4种装入表的方式
  APPEND // 原先的表有数据 就加在后面
  // INSERT // 装载空表 如果原先的表有数据 sqlloader会停止 默认值
  // REPLACE // 原先的表有数据 原先的数据会全部删除
  // TRUNCATE // 指定的内容和replace的相同 会用truncate语句删除现存数据
   
  ************* 指定的TERMINATED可以在表的开头 也可在表的内部字段部分
  FIELDS TERMINATED BY ',' OPTIONALLY ENCLOSED BY '"'
  // 装载这种数据: 10,lg,"""lg""","lg,lg"
  // 在表中结果: 10 lg "lg" lg,lg
  // TERMINATED BY X '09' // 以十六进制格式 '09' 表示的
  // TERMINATED BY WRITESPACE // 装载这种数据: 10 lg lg
  
  TRAILING NULLCOLS ************* 表的字段没有对应的值时允许为空
  
  ************* 下面是表的字段
  (
  col_1 , col_2 ,col_filler FILLER // FILLER 关键字 此列的数值不会被装载
   // 如: lg,lg,not 结果 lg lg
  )
  // 当没声明FIELDS TERMINATED BY ',' 时
  // (
  // col_1 [interger external] TERMINATED BY ',' ,
   // col_2 [date "dd-mon-yyy"] TERMINATED BY ',' ,
  // col_3 [char] TERMINATED BY ',' OPTIONALLY ENCLOSED BY 'lg'
  // )
  // 当没声明FIELDS TERMINATED BY ','用位置告诉字段装载数据
  // (
  // col_1 position(1:2),
  // col_2 position(3:10),
  // col_3 position(*:16), // 这个字段的开始位置在前一字段的结束位置
  // col_4 position(1:16),
   // col_5 position(3:10) char(8) // 指定字段的类型
  // )
  
   BEGINDATA // 对应开始的 INFILE * 要导入的内容就在control文件里
  10,Sql,what
   20,lg,show
  
   =====================================================================================
  //////////// 注意begindata后的数值前面不能有空格
  
  1 ***** 普通装载
   LOAD DATA
  INFILE *
  INTO TABLE DEPT
  REPLACE
   FIELDS TERMINATED BY ',' OPTIONALLY ENCLOSED BY '"'
  (DEPTNO,
   DNAME,
  LOC
  )
  BEGINDATA
  10,Sales,"""USA"""
   20,Accounting,"Virginia,USA"
  30,Consulting,Virginia
   40,Finance,Virginia
  50,"Finance","",Virginia // loc 列将为空
   60,"Finance",,Virginia // loc 列将为空
  
  2 ***** FIELDS TERMINATED BY WHITESPACE 和 FIELDS TERMINATED BY x'09' 的情况
  LOAD DATA
  INFILE *
  INTO TABLE DEPT
  REPLACE
  FIELDS TERMINATED BY WHITESPACE
  -- FIELDS TERMINATED BY x'09'
   (DEPTNO,
  DNAME,
  LOC
  )
  BEGINDATA
  10 Sales Virginia
  
  3 ***** 指定不装载那一列
  LOAD DATA
  INFILE *
   INTO TABLE DEPT
  REPLACE
  FIELDS TERMINATED BY ',' OPTIONALLY ENCLOSED BY '"'
  ( DEPTNO,
  FILLER_1 FILLER, // 下面的 "Something Not To Be Loaded" 将不会被装载
  DNAME,
  LOC
  )
   BEGINDATA
  20,Something Not To Be Loaded,Accounting,"Virginia,USA"
  
  4 ***** position的列子
  LOAD DATA
  INFILE *
   INTO TABLE DEPT
  REPLACE
  ( DEPTNO position(1:2),
  DNAME position(*:16), // 这个字段的开始位置在前一字段的结束位置
  LOC position(*:29),
   ENTIRE_LINE position(1:29)
  )
  BEGINDATA
  10Accounting Virginia,USA
  
  5 ***** 使用函数 日期的一种表达 TRAILING NULLCOLS的使用
   LOAD DATA
  INFILE *
  INTO TABLE DEPT
  REPLACE
   FIELDS TERMINATED BY ','
  TRAILING NULLCOLS // 其实下面的ENTIRE_LINE在BEGINDATA后面的数据中是没有直接对应
  // 的列的值的 如果第一行改为 10,Sales,Virginia,1/5/2000,, 就不用TRAILING NULLCOLS了
  (DEPTNO,
   DNAME "upper(:dname)", // 使用函数
  LOC "upper(:loc)",
   LAST_UPDATED date 'dd/mm/yyyy', // 日期的一种表达方式 还有'dd-mon-yyyy' 等
   ENTIRE_LINE ":deptno||:dname||:loc||:last_updated"
  )
   BEGINDATA
  10,Sales,Virginia,1/5/2000
   20,Accounting,Virginia,21/6/1999
  30,Consulting,Virginia,5/1/2000
   40,Finance,Virginia,15/3/2001
  
  6 ***** 使用自定义的函数 // 解决的时间问题
   create or replace
  function my_to_date( p_string in varchar2 ) return date
  as
  type fmtArray is table of varchar2(25);
   
  l_fmts fmtArray := fmtArray( 'dd-mon-yyyy', 'dd-month-yyyy',
   'dd/mm/yyyy',
  'dd/mm/yyyy hh24:mi:ss' );
  l_return date;
   begin
  for i in 1 .. l_fmts.count
  loop
  begin
   l_return := to_date( p_string, l_fmts(i) );
  exception
  when others then null;
  end;
  EXIT when l_return is not null;
   end loop;
  
  if ( l_return is null )
  then
   l_return :=
  new_time( to_date('01011970','ddmmyyyy') + 1/24/60/60 *
  p_string, 'GMT', 'EST' );
  end if;
  
  return l_return;
  end;
  /
  
  LOAD DATA
  INFILE *
   INTO TABLE DEPT
  REPLACE
  FIELDS TERMINATED BY ','
   TRAILING NULLCOLS
  (DEPTNO,
  DNAME "upper(:dname)",
  LOC "upper(:loc)",
  LAST_UPDATED "my_to_date( :last_updated )" // 使用自定义的函数
  )
  BEGINDATA
  10,Sales,Virginia,01-april-2001
   20,Accounting,Virginia,13/04/2001
   30,Consulting,Virginia,14/04/2001 12:02:02
   40,Finance,Virginia,987268297
  50,Finance,Virginia,02-apr-2001
   60,Finance,Virginia,Not a date
  
  7 ***** 合并多行记录为一行记录
   LOAD DATA
  INFILE *
  concatenate 3 // 通过关键字concatenate 把几行的记录看成一行记录
  INTO TABLE DEPT
  replace
  FIELDS TERMINATED BY ','
  (DEPTNO,
  DNAME "upper(:dname)",
  LOC "upper(:loc)",
  LAST_UPDATED date 'dd/mm/yyyy'
  )
   BEGINDATA
  10,Sales, // 其实这3行看成一行 10,Sales,Virginia,1/5/2000
   Virginia,
  1/5/2000
  // 这列子用 continueif list="," 也可以
  告诉 sqlldr在每行的末尾找逗号 找到逗号就把下一行附加到上一行
  
  LOAD DATA
  INFILE *
   continueif this(1:1) = '-' // 找每行的开始是否有连接字符 - 有就把下一行连接为一行
  // 如 -10,Sales,Virginia,
  // 1/5/2000 就是一行 10,Sales,Virginia,1/5/2000
   // 其中1:1 表示从第一行开始 并在第一行结束 还有continueif next 但continueif list最理想
   INTO TABLE DEPT
  replace
  FIELDS TERMINATED BY ','
   (DEPTNO,
  DNAME "upper(:dname)",
  LOC "upper(:loc)",
   LAST_UPDATED date 'dd/mm/yyyy'
  )
  BEGINDATA // 但是好象不能象右面的那样使用
  -10,Sales,Virginia, -10,Sales,Virginia,
  1/5/2000 1/5/2000
   -40, 40,Finance,Virginia,13/04/2001
  Finance,Virginia,13/04/2001
   
  8 ***** 载入每行的行号
  
  load data
  infile *
  into table t
  replace
  ( seqno RECNUM //载入每行的行号
  text Position(1:1024))
  BEGINDATA
  fsdfasj //自动分配一行号给载入 表t 的seqno字段 此行为 1
  fasdjfasdfl // 此行为 2

 

 

Sample:

echo "[`date +%H:%M:%S`] Exporting Table SAMPLE_TABLE..." |tee -a $logfile
DATAFILE=`date +%Y-%m-%d.%H:%M:%S`.sample_table.csv
$SQLPLUS -S -L $DBCONNECT_STRING << EOF > /dev/null 2>&1
whenever sqlerror exit sql.sqlcode||sqlerrm;
set termout off
set echo off
set serveroutput off
set feedback off
set heading off
set verify off
set trimspool on
set trimout on
set pagesize 0
set linesize 500
spool $DATADIR/$DATAFILE
select '"'||SAMPLE_FIELD1||'","'||SAMPLE_FIELD2||'"' FROM SAMPLE_TABLE WHERE DATE=TO_CHAR(SYSDATE, 'YYYYMMDD');
spool off
quit
EOF

 

ERRORCODE=$?
if [ $ERRORCODE != 0 ]
then
 echo "[`date +%H:%M:%S`] ERROR: Exporting Data for Table SAMPLE_TABLE Failed. ErrorCode: $ERRORCODE" |tee -a $logfile
 echo "------ Log File ------"
 tail -10 $logfile
 exit -1
else
 echo "[`date +%H:%M:%S`] Exported Data for Table SAMPLE_TABLE Successfully." |tee -a $logfile
fi

 

echo "[`date +%H:%M:%S`] Importing Tables..." |tee -a $logfile
$SQLLDR $DBCONNECT_STRING BAD=$LOGDIR/$DATAFILE.bad CONTROL=$CTLDIR/SAMPLE_TABLE.ctl DATA=$DATADIR/$DATAFILE LOG=$LOGDIR/$DATAFILE.log SILENT=HEADER, FEEDBACK >> $logfile 2>&1

if [ -e $LOGDIR/$DATAFILE.bad ]; then
 echo "[`date +%H:%M:%S`] There are bad data during loading table SAMPLE_TABLE" |tee -a $logfile
 exit -1
fi

 

分享到:
评论

相关推荐

    spool导出与sqlldr导入

    在Oracle数据库管理中,"spool"和"sqlldr"是两种非常实用的工具,用于数据的导出和导入操作。下面将详细解释这两个概念及其使用方法。 **1. Spool导出** Spool是Oracle SQL*Plus中的一个功能,它允许用户将SQL*...

    关于spool 和 sqlldr 的实例代码

    在数据库管理中,`Spool` 和 `SQL*Loader` 是两种非常重要的工具,尤其在数据导入导出和批量处理方面。本实例将探讨如何在Linux环境下利用Shell脚本配合这两种工具实现高效的数据操作。 首先,`Spool` 是Oracle SQL...

    【数据泵】EXPDP导出表结构(真实案例).pdf

    - SQL*Loader(sqlldr)和spool命令:这些是Oracle数据库中用来加载数据和执行批处理操作的命令。 以上总结的知识点是基于文档内容的概述,并通过个人理解和实际经验加以延伸。本文档对于希望学习和掌握Oracle数据...

    sqlldr自动生成控制文件导入到表

    使用`ora_load.sh`脚本来自动化导出源数据库中的表数据,然后在目标数据库上创建相同的表结构,接着通过FTP传输数据文件到目标数据库,并执行`batch_load_data.sh`脚本来导入数据。导出数据时,利用`spool`功能将...

    oracle sqlloader使用指南

    总结来说,Oracle SQL*Loader是一个功能强大的数据导入工具,它通过控制文件灵活配置,可以处理各种复杂的数据格式,同时支持数据的转换和修改,是Oracle数据库管理和维护中不可或缺的一部分。了解并熟练掌握SQL*...

    oracle数据与文本导入导出源码示例

    方便的实现oracle导出数据到txt、txt导入数据到oracle。 一、导出数据到txt 用all_objects表做测试 SQL&gt; desc all_objects; Name Null? Type ----------------------------------------- -------- ------------...

    EXCEL,TXT文档数据和ORACLE数据互导的方法

    这两种工具都可以用来批量导入数据。例如,使用SQL*Loader命令行工具: ``` sqlldr userid=your_username/your_password control=c:\control_file.ctl log=c:\log_file.log data=c:\data.csv ``` 其中`control_...

    Oracle备份与恢复总结

    - **以SYSDBA进行导出/导入:** 使用`grant=selectanytable`参数以SYSDBA权限导出或导入数据。 - **表空间传输(速度快):** 使用`transportable=always`参数,可以快速传输表空间数据。 **1.3 优化** - **加快...

    【精品】Oracle 数据库备份与恢复总结.doc

    - **基本命令**:`exp`用于导出数据,`imp`用于导入数据。例如,`exp user/pass file=backup.dmp` 导出指定用户的数据库对象,`imp user/pass file=backup.dmp`则导入备份文件。 - **获取帮助**:在命令行中输入...

    Oracle数据库备份与恢复总结

    - **IMP**: 用于向数据库导入数据。 - `imp username/password [参数]` **1.2 高级选项** - **分割成多个文件**: 可以通过`file`参数指定多个文件名。 - 示例: `exp system/pass file=d:\data1.dmp,d:\data2.dmp...

    Oracle数据加载和卸载的实现方法

    除了上述方法,Oracle还提供了其他数据加载和卸载工具,如`Data Pump`(expdp/impdp),它可以实现高效的数据导出和导入,支持压缩和并行处理,适用于大数据量的场景。数据泵不仅可以导出完整的数据库、表、视图,还...

    ORACLE常用命令

    - `IMPDP`:导入数据,例如`IMPDP username/password DIRECTORY=dir_name DUMPFILE=dumpfile.dmp TABLES=(table1,table2)`。 - `RMAN`:Oracle的恢复管理器,用于数据库备份和恢复的高级工具。 6. **性能优化**:...

    Oracle 数据库备份与恢复总结.pdf

    - **通过unix/LinuxPIPE管道加快exp/imp速度**: 利用管道直接连接导出和导入操作,避免磁盘I/O操作。 - **全库导入的一般步骤**: 包括创建用户、授予必要的权限、执行导入等步骤。 **1.4 常见问题** - **字符集...

    Oracle SQL Loader的详细语法

    - **导入数据时修改数据** 可以在导入过程中对数据进行转换或修改: ```plaintext LOAD DATA INFILE * INTO TABLE modified_data (rec_no "my_db_sequence.nextval", region CONSTANT '31', time_loaded ...

    oracle sqlloader使用指南.doc

    Oracle SQL*Loader是Oracle数据库系统提供的一个强大工具,用于快速高效地从外部数据文件批量导入数据到数据库中。它的灵活性和可配置性使得用户可以根据不同的数据格式和需求进行定制化的数据加载。 首先,使用SQL...

    Oracle sqlloader使用指南

    除了导入数据,Oracle并没有内置的工具用于将数据导出到文件,但可以使用SQL*Plus的`spool`命令结合`SELECT`语句来实现。例如: ```sql set echo off newpage 0 space 0 pagesize 0 feed off head off trimspool on...

Global site tag (gtag.js) - Google Analytics