1.下载安装包及解压
sqoop-1.4.5.bin__hadoop-1.0.0.tar.gz
2.配置环境变量和配置文件
cd %SQOOP_HOME%
cp conf/sqoop-env-template.sh /conf/sqoop-env.sh
在sqoop-env.sh中添加如下代码:
export HADOOP_COMMON_HOME=/home/hadoop/hadoop
export HADOOP_MAPRED_HOME=/home/hadoop/hadoop
export HBASE_HOME=/home/hadoop/hbase
export HIVE_HOME=/home/hadoop/hive
export ZOOCFGDIR=/home/hadoop/zookeeper
(如果数据读取不设计hbase和hive,那么相关hbase和hive的配置可以不加,如果集群有独立的zookeeper集群,那么配置zookeeper,反之,不用配置)。3.copy需要的lib包到Sqoop/lib
所需的包:hadoop-core包、mysql的jdbc包(或Oracle的jdbc包等)
cp ~/hadoop/hadoop-core-1.0.4.jar ~/sqoop/lib/
cp mysql-connector-java-5.1.18.jar ~/sqoop/lib/
4.添加环境变量
gedit /etc/profile
export SQOOP_HOME=/home/hadoop/sqoop-1.4.5.bin__hadoop-1.0.0
export PATH=$SQOOP_HOME/bin:$PATH
export LOGDIR=$SQOOP_HOME/logs
5.测试验证
--列出mysql数据库中的所有数据库
sqoop list-databases --connect jdbc:mysql://ubuntu201:3306 --username root --password gxw
--连接mysql并列出hive数据库中的表
--(命令中的hive为mysql数据库中的hive数据库名称 username password分别为mysql数据库的用户密码)
sqoop list-tables --connect jdbc:mysql://ubuntu201:3306/hive --username root --password gxw
sqoop import --connect jdbc:mysql://host001/test --username root --password szy --table person
sqoop import --connect jdbc:mysql://host001/test --username root --password szy --table person -m 1
sqoop import --connect jdbc:mysql://host001/test --username root --password szy --table person --direct -m 1
sqoop import-all-tables --connect jdbc:mysql://host001/test --username root --password szy --direct -m 1
sqoop export --connect jdbc:mysql://host001/test --username root --password szy --table person --export-dir person
sqoop export --connect jdbc:mysql://host001/test --username root --password szy --table animal --export-dir animal
相关推荐
在版本 1.4.5 中, Sqoop 提供了稳定性和性能优化,支持多种数据库和数据格式。 Sqoop 的核心功能包括: 1. **数据导入**:Sqoop 可以创建 SQL 查询来抽取所需的数据,然后将这些数据转换为适合 Hadoop MapReduce...
在 Sqoop 1.4.5 用户手册中,它详细阐述了如何利用 Sqoop 实现数据的导入、导出和其他相关操作。 首先,Sqoop 允许用户将数据从常见的 RDBMS,如 MySQL 或 Oracle,导入到 HDFS。这个过程是通过 MapReduce 实现的,...
- 安装:解压`sqoop-1.4.5.bin__hadoop-2.0.4-alpha.tar`到你的Hadoop环境,确保配置文件中添加了Hadoop的相关路径。 - 配置:修改`$SQOOP_HOME/conf/sqoop-site.xml`,设置数据库连接参数,如JDBC驱动路径、...
标签“sqoop1.4.5”、“cdh”和“大数据”进一步强调了这个版本的Sqoop是针对大数据环境,特别是CDH5.4.2设计的。CDH是Cloudera提供的一种企业级Hadoop发行版,包含多个Hadoop生态系统组件,如HDFS、MapReduce、...
《全面解析:Sqoop-1.4.5在Hadoop-2.0.4-alpha环境下的安装与使用》 Sqoop是一款开源的数据迁移工具,它主要用于在关系型数据库(如MySQL、Oracle等)和Hadoop之间进行数据的导入导出。在大数据处理中,Sqoop扮演...
在这个场景中,我们讨论的是 Sqoop 的特定版本——"sqoop-1.4.5-cdh5.3.6",它是针对 Cloudera Distribution Including Apache Hadoop (CDH) 的定制版本。 CDH 是 Cloudera 公司提供的一个企业级的 Hadoop 分发版,...
版本Sqoop是一个用来将Hadoop和关系型数据库中的数据相互转移的工具,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库中。...
Sqoop 组件安装配置 Sqoop 是一个开源的数据传输工具,用于在 Hadoop 和结构化数据存储之间传输数据。 Sqoop 提供了一个命令行界面,允许用户定义数据传输的参数和配置。Sqoop 的安装和配置是将其集成到 Hadoop ...
Sqoop-1.4.5.bin__hadoop-2.6.0.zip 文件是一个包含了 Sqoop 版本 1.4.5 和针对 Hadoop 版本 2.6.0 的预编译二进制包,方便用户在 Hadoop 环境中快速部署和使用 Sqoop。 Sqoop 的主要功能包括: 1. 数据导入:从...
解压这个压缩包后,我们可以通过编译、配置和安装步骤将 Sqoop 安装到集群的各个节点上。 在 CDH 5.5.0 中, Sqoop 支持多种操作,包括数据导入、导出、更新和删除。以下是 Sqoop 常用的一些核心功能: 1. 数据...
- 安装与配置:首先在 Hadoop 集群上安装 Sqoop,配置相关数据库连接信息。 - 数据库连接:使用 `sqoop list-databases` 和 `sqoop list-tables` 命令查看可用数据库和表。 - 导入数据:使用 `sqoop import` 命令...
mv /usr/local/sqoop-1.4.6-cdh5.13.2/conf/sqoop-env.template.sh /usr/local/sqoop-1.4.6-cdh5.13.2/conf/sqoop-env.sh vi /usr/local/sqoop-1.4.6-cdh5.13.2/conf/sqoop-env.sh export HADOOP_COMMON_HOME=/usr/...
1. **下载 Sqoop**:可以从Apache官网或其他镜像站点下载对应版本的Sqoop,例如1.4.5版本支持Hadoop 1.X。 2. **解压并移动安装包**:将下载的安装包解压至指定目录,如 `/app` 目录。 3. **配置环境变量**:在 `/...
在本例中,我们将学习如何在 Linux 环境下安装部署 Sqoop 1,并配置与 MySQL 数据库的连接。 首先,我们从资源目录中获取 Sqoop 的安装包。在终端中,使用 `cp` 命令将 Sqoop 的 tarball 文件复制到当前用户的主...
本文档适用于Sqoop 1.4.5-cdh5.3.0版本,提及了MySQL的JDBC驱动版本为5.1.32。在使用Sqoop时,需要确保JDBC驱动的jar包放置在Java类路径下,对于MySQL而言,该jar包路径为/usr/share/java/。 在基本用法方面,Sqoop...
sqoop框架开发工具使用的jar sqoop-1.4.6.jar 手动安装到maven <groupId>org.apache.sqoop <artifactId>sqoop <version>1.4.6 </dependency>
Version : sqoop1.4.5 (CDH540) Description 在Sqoop import的方法中,增加生成ORC File格式的命令. Build 源码取自于 使用ant build Usage 在import命令中,增加: --as-orcdatafile Examples sqoop import -D ...
安装Sqoop时,需要下载`mysql-connection-java-5.1.29bin.jar`作为MySQL的JDBC驱动,以及Sqoop的jar包,如`sqoop-1.4.5.jar`。注意选择与Hadoop版本兼容的Sqoop版本。配置文件的修改是关键步骤,包括修改`/etc/...
2.安装hadoop、hive、zookeeper、sqoop ``` $ brew install hadoop $ brew install hive $ brew install zookeeper $ brew link zookeeper ``` 3.下载sqoop并安装mysql驱动 ``一个。 去 b。 下载 sqoop-1.4.5.bin__...