参考:
http://f.dataguru.cn/thread-54454-1-1.html
http://archive.cloudera.com/cdh/3/sqoop-1.2.0-CDH3B4/SqoopUserGuide.html
虚拟机环境:
redhat 5
软件版本:
下面是CDH3和SQOOP 1.2.0的下载地址
http://archive.cloudera.com/cdh/3/hadoop-0.20.2-CDH3B4.tar.gz
http://archive.cloudera.com/cdh/3/sqoop-1.2.0-CDH3B4.tar.gz
复制JAR
[hadoop@hadooporacle hadoop]$ cp hadoop-0.20.2-CDH3B4/hadoop-core-0.20.2-CDH3B4.jar sqoop-1.2.0-CDH3B4/lib/
[hadoop@hadooporacle hadoop]$ cp /home/ojdbc6_g.jar sqoop-1.2.0-CDH3B4/lib/
修改SQOOP的文件configure-sqoop
由于Shell不支持直接多行注释,最常用的两个方法是:
注意
1)
<< EOF
中间是要注释的语句块
EOF
2)
使用逻辑判断
if [ ]; then
fi
注意[]中间要有个空格。
还有其他HBASE和ZOOKEEPER的部分也需要注释掉。
一共很好几个地方
启动hadoop
注意目录
4.常用的sqoop命令:
1)连接oracle并列出数据库中的表
sqoop list-tables --connect jdbc:oracle:thin:@192.168.80.60:1521:hadoop --username scott --password=oracle
3)从Oracle导入数据到hive
sqoop import --hive-import --connect jdbc:oracle:thin:@192.168.80.60:1521:hadoop --username scott --password=oracle --verbose -m 1 --table emp
原因是没有用
原因是:表名在大写
sqoop import --hive-import --connect jdbc:oracle:thin:@192.168.80.60:1521:hadoop --username scott --password=oracle --verbose -m 1 --table EMP
测试
相关推荐
1. **Sqoop 的作用**:Sqoop 是为了解决 Hadoop 与传统 RDBMS 之间的数据交换问题而设计的。它支持将大量结构化数据导入到 Hadoop 中进行大数据分析,同时也能够将处理后的结果导回 RDBMS。 2. **版本信息**:1.4.2...
Sqoop 是一个开源工具,主要用于在关系型数据库(如 MySQL、Oracle 等)与 Hadoop 分布式文件系统(HDFS)之间高效地导入和导出数据。它弥补了传统 ETL 工具在大数据处理场景下的不足,提供了一种简单、灵活的方式来...
在这个“Hive,Sqoop相关实验室”中,我们将深入探讨这两个工具的功能、用法以及如何结合使用它们来实现高效的数据操作。 Hive是一个基于Hadoop的数据仓库工具,它允许用户使用SQL(HiveQL)语句来查询和管理大规模...
Sqoop是Apache Hadoop生态中的一个工具,专门用于在关系型数据库(如MySQL、Oracle等)和Hadoop之间进行数据的导入导出。这个压缩包"sqoop-1.4.3.bin__hadoop-1.0.0.tar.gz"是Sqoop 1.4.3版本针对Hadoop 1.0.0的二...
Apache Sqoop是一个专门为大数据处理设计的数据迁移工具,它允许用户从传统的关系型数据库管理系统(RDBMS)如MySQL、Oracle等,高效地导入到Hadoop的HDFS(Hadoop Distributed File System)中,或者从HDFS导出数据...
1. **数据导入**:Sqoop 可以将结构化的数据从关系型数据库管理系统(RDBMS)如 MySQL、Oracle 等导入到 HDFS,然后可以进一步使用 MapReduce 或 Hive 进行分析和处理。 2. **数据导出**:反之,Sqoop 也可以将 HDFS...
- 数据导入:Sqoop 可以从常见的关系型数据库如 MySQL、Oracle、PostgreSQL 等中将结构化数据高效地导入到 HDFS 或 Hive 中,支持批量和增量导入。 - 数据导出:同样,Sqoop 也能将 HDFS 或 Hive 中的数据导出回 ...
Sqoop 是一个在 Hadoop 生态系统中用于数据导入导出的工具,它允许用户将关系型数据库(如 MySQL、Oracle 等)中的数据高效地导入到 Hadoop 的 HDFS 中,或者从 HDFS 导回到关系型数据库。这个"sqoop-1.4.6-hadoop-...
Sqoop 是一款用于批量迁移结构化数据到 Hadoop 生态系统中的工具,它使得 SQL 数据库与 Hadoop 之间的数据交换变得简单。通过使用 MapReduce,Sqoop 可以并行处理大量数据,从而实现快速的数据导入导出。此外,它还...
Sqoop 是 Apache 开源项目中的一款工具,专门用于在关系型数据库(如 MySQL、Oracle 等)和 Hadoop 的 HDFS 之间进行数据传输。它简化了大数据环境中的数据导入和导出过程,使传统数据库的数据能方便地融入到 Hadoop...
此外,对于大规模数据的处理,还可以考虑使用 Sqoop 的分批导入和导出功能,以及结合 Hive 进行数据预处理,进一步提高数据迁移的效率。 在数据仓库的构建和大数据分析场景中,Sqoop 的作用不可忽视。它简化了数据...
Apache Sqoop是一个专门为大数据处理设计的数据迁移工具,它允许用户从关系型数据库管理系统(RDBMS)如MySQL、Oracle、DB2等导入数据到Hadoop的HDFS、Hive、HBase等组件,同时也能将数据导出回RDBMS。Sqoop利用...
Sqoop 是一个专门为 Hadoop 设计的开源工具,它的主要任务是在传统的关系型数据库(如 MySQL、Oracle、PostgreSQL)和 Hadoop 分布式文件系统(HDFS)之间进行数据的转移。该项目始于2009年,最初是作为 Hadoop 生态...
4. 其他功能:Sqoop还支持数据分片导入、导入到Hive、数据增量导入等高级功能。例如,使用`--incremental`参数实现增量导入,以及使用`--merge-key`指定合并键。 5. 安装文档:提供的安装文档可能包括Sqoop的用户...
作为RDBMS与Hadoop之间的桥梁,Sqoop提供了数据导入和导出的能力,允许用户将数据库中的数据导入到Hadoop生态中的HBase、Hive等系统,同时也支持将Hadoop系统中的数据导出回关系型数据库。 【Sqoop产生背景】 随着...
Sqoop 1.99.0 是 Apache Sqoop 的一个重要版本,它是一个专门设计用于在关系型数据库(如 MySQL、Oracle 等)与 Hadoop 分布式文件系统(HDFS)之间高效传输数据的工具。这个版本是在 Hadoop 生态系统中广泛使用的,...
Sqoop的主要功能在于实现Hadoop生态(如Hive)与MySQL、Oracle等关系数据库之间的数据交换。它可以将关系型数据库的数据批量导入到Hadoop的HDFS中,同时也可以将HDFS中的数据导出到关系型数据库,为大数据分析提供...
这个版本的Sqoop提供了强大的数据导入导出功能,帮助用户在传统数据库和Hadoop分布式文件系统(HDFS)之间进行高效的数据交换。 Sqoop的设计目标是为了弥补Hadoop与传统关系数据库管理系统(RDBMS)之间的鸿沟。在...
3. **广泛兼容性**:Sqoop支持多种主流的关系型数据库,如MySQL、Oracle、SQL Server和DB2等,同时也可与Hive、HBase等大数据存储系统交互。 【Sqoop1与Sqoop2的比较】 **Sqoop1** 是最初的版本,只有一个Sqoop...