`
pftzzg
  • 浏览: 10197 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

11_sqoop_oracle_hive 数据交换实验

 
阅读更多

参考:

 

http://f.dataguru.cn/thread-54454-1-1.html
http://archive.cloudera.com/cdh/3/sqoop-1.2.0-CDH3B4/SqoopUserGuide.html

 

虚拟机环境:

  redhat 5

软件版本:

 

下面是CDH3和SQOOP 1.2.0的下载地址

http://archive.cloudera.com/cdh/3/hadoop-0.20.2-CDH3B4.tar.gz
http://archive.cloudera.com/cdh/3/sqoop-1.2.0-CDH3B4.tar.gz

复制JAR

 

[hadoop@hadooporacle hadoop]$ cp hadoop-0.20.2-CDH3B4/hadoop-core-0.20.2-CDH3B4.jar sqoop-1.2.0-CDH3B4/lib/


[hadoop@hadooporacle hadoop]$ cp /home/ojdbc6_g.jar  sqoop-1.2.0-CDH3B4/lib/

 

修改SQOOP的文件configure-sqoop



 

 

 

由于Shell不支持直接多行注释,最常用的两个方法是:

注意

1

<< EOF

中间是要注释的语句块

EOF

 

2

 使用逻辑判断

 if [ ]; then

fi

注意[]中间要有个空格。

 

还有其他HBASE和ZOOKEEPER的部分也需要注释掉。

一共很好几个地方

 

启动hadoop

 

注意目录

4.常用的sqoop命令:

1)连接oracle并列出数据库中的表

sqoop list-tables --connect jdbc:oracle:thin:@192.168.80.60:1521:hadoop --username scott --password=oracle

 

3)从Oracle导入数据hive

 

 sqoop import --hive-import --connect  jdbc:oracle:thin:@192.168.80.60:1521:hadoop  --username scott --password=oracle --verbose -m 1 --table emp

 

 

原因是没有用
 



 

原因是:表名在大写

 

 sqoop import --hive-import --connect  jdbc:oracle:thin:@192.168.80.60:1521:hadoop  --username scott --password=oracle --verbose -m 1 --table EMP



 

测试

 
 
 


 
 



 
 
 

 

 

 

 

  • 大小: 17 KB
  • 大小: 80.7 KB
  • 大小: 14.2 KB
  • 大小: 19.8 KB
  • 大小: 39.6 KB
  • 大小: 62.6 KB
  • 大小: 11.2 KB
  • 大小: 156.2 KB
  • 大小: 24.5 KB
  • 大小: 65.9 KB
  • 大小: 85.9 KB
  • 大小: 93.8 KB
分享到:
评论

相关推荐

    sqoop-1.4.2.bin__hadoop-2.0.0-alpha.tar

    1. **Sqoop 的作用**:Sqoop 是为了解决 Hadoop 与传统 RDBMS 之间的数据交换问题而设计的。它支持将大量结构化数据导入到 Hadoop 中进行大数据分析,同时也能够将处理后的结果导回 RDBMS。 2. **版本信息**:1.4.2...

    sqoop-1.4.6.bin__hadoop-0.23.tar.gz

    Sqoop 是一个开源工具,主要用于在关系型数据库(如 MySQL、Oracle 等)与 Hadoop 分布式文件系统(HDFS)之间高效地导入和导出数据。它弥补了传统 ETL 工具在大数据处理场景下的不足,提供了一种简单、灵活的方式来...

    hive_labs:Hive,Sqoop相关实验室

    在这个“Hive,Sqoop相关实验室”中,我们将深入探讨这两个工具的功能、用法以及如何结合使用它们来实现高效的数据操作。 Hive是一个基于Hadoop的数据仓库工具,它允许用户使用SQL(HiveQL)语句来查询和管理大规模...

    sqoop-1.4.3.bin__hadoop-1.0.0.tar.gz

    Sqoop是Apache Hadoop生态中的一个工具,专门用于在关系型数据库(如MySQL、Oracle等)和Hadoop之间进行数据的导入导出。这个压缩包"sqoop-1.4.3.bin__hadoop-1.0.0.tar.gz"是Sqoop 1.4.3版本针对Hadoop 1.0.0的二...

    Apache的sqoop项目

    Apache Sqoop是一个专门为大数据处理设计的数据迁移工具,它允许用户从传统的关系型数据库管理系统(RDBMS)如MySQL、Oracle等,高效地导入到Hadoop的HDFS(Hadoop Distributed File System)中,或者从HDFS导出数据...

    Hadoop深入浅出之Sqoop介绍.pptx

    1. **数据导入**:Sqoop 可以将结构化的数据从关系型数据库管理系统(RDBMS)如 MySQL、Oracle 等导入到 HDFS,然后可以进一步使用 MapReduce 或 Hive 进行分析和处理。 2. **数据导出**:反之,Sqoop 也可以将 HDFS...

    Apache Hadoop---Sqoop.docx

    - 数据导入:Sqoop 可以从常见的关系型数据库如 MySQL、Oracle、PostgreSQL 等中将结构化数据高效地导入到 HDFS 或 Hive 中,支持批量和增量导入。 - 数据导出:同样,Sqoop 也能将 HDFS 或 Hive 中的数据导出回 ...

    sqoop-1.4.6-hadoop-2.6最小资源包

    Sqoop 是一个在 Hadoop 生态系统中用于数据导入导出的工具,它允许用户将关系型数据库(如 MySQL、Oracle 等)中的数据高效地导入到 Hadoop 的 HDFS 中,或者从 HDFS 导回到关系型数据库。这个"sqoop-1.4.6-hadoop-...

    Sqoop-linux.zip

    Sqoop 是一款用于批量迁移结构化数据到 Hadoop 生态系统中的工具,它使得 SQL 数据库与 Hadoop 之间的数据交换变得简单。通过使用 MapReduce,Sqoop 可以并行处理大量数据,从而实现快速的数据导入导出。此外,它还...

    sqoop 使用手册

    Sqoop 是 Apache 开源项目中的一款工具,专门用于在关系型数据库(如 MySQL、Oracle 等)和 Hadoop 的 HDFS 之间进行数据传输。它简化了大数据环境中的数据导入和导出过程,使传统数据库的数据能方便地融入到 Hadoop...

    sqoop详细开发手册(开发,优化,参数解释等)

    此外,对于大规模数据的处理,还可以考虑使用 Sqoop 的分批导入和导出功能,以及结合 Hive 进行数据预处理,进一步提高数据迁移的效率。 在数据仓库的构建和大数据分析场景中,Sqoop 的作用不可忽视。它简化了数据...

    1、Apache Sqoop介绍及部署

    Apache Sqoop是一个专门为大数据处理设计的数据迁移工具,它允许用户从关系型数据库管理系统(RDBMS)如MySQL、Oracle、DB2等导入数据到Hadoop的HDFS、Hive、HBase等组件,同时也能将数据导出回RDBMS。Sqoop利用...

    大数据-sqoop.pptx

    Sqoop 是一个专门为 Hadoop 设计的开源工具,它的主要任务是在传统的关系型数据库(如 MySQL、Oracle、PostgreSQL)和 Hadoop 分布式文件系统(HDFS)之间进行数据的转移。该项目始于2009年,最初是作为 Hadoop 生态...

    Sqoop安装包、安装文档

    4. 其他功能:Sqoop还支持数据分片导入、导入到Hive、数据增量导入等高级功能。例如,使用`--incremental`参数实现增量导入,以及使用`--merge-key`指定合并键。 5. 安装文档:提供的安装文档可能包括Sqoop的用户...

    离线采集工具Sqoop文档.doc

    作为RDBMS与Hadoop之间的桥梁,Sqoop提供了数据导入和导出的能力,允许用户将数据库中的数据导入到Hadoop生态中的HBase、Hive等系统,同时也支持将Hadoop系统中的数据导出回关系型数据库。 【Sqoop产生背景】 随着...

    sqoop1.99.0

    Sqoop 1.99.0 是 Apache Sqoop 的一个重要版本,它是一个专门设计用于在关系型数据库(如 MySQL、Oracle 等)与 Hadoop 分布式文件系统(HDFS)之间高效传输数据的工具。这个版本是在 Hadoop 生态系统中广泛使用的,...

    第十二节、sqoop的安装与使用.pdf1

    Sqoop的主要功能在于实现Hadoop生态(如Hive)与MySQL、Oracle等关系数据库之间的数据交换。它可以将关系型数据库的数据批量导入到Hadoop的HDFS中,同时也可以将HDFS中的数据导出到关系型数据库,为大数据分析提供...

    【DT-BigData】Sqoop-1.4.6.gz

    这个版本的Sqoop提供了强大的数据导入导出功能,帮助用户在传统数据库和Hadoop分布式文件系统(HDFS)之间进行高效的数据交换。 Sqoop的设计目标是为了弥补Hadoop与传统关系数据库管理系统(RDBMS)之间的鸿沟。在...

    Hadoop Sqoop介绍及安装部署.pdf

    3. **广泛兼容性**:Sqoop支持多种主流的关系型数据库,如MySQL、Oracle、SQL Server和DB2等,同时也可与Hive、HBase等大数据存储系统交互。 【Sqoop1与Sqoop2的比较】 **Sqoop1** 是最初的版本,只有一个Sqoop...

Global site tag (gtag.js) - Google Analytics