sqoop是一款开源的工具,主要用于hfds/hive和传统关系型数据库(mysql,postgresql....)之间的数据的迁移
1、安装:只要在集群中的一台机器上安装sqoop就可以使用了,经常使用的话讲sqoop加入到环境变量中
将mysql的驱动jar包拷贝到sqoop/lib下面
2、常用命令:
第一类:
数据库中的数据导入到HDFS上
sqoop import --connect jdbc:mysql://192.168.1.10:3306/db --username root --password 123 --table trade_detail --columns 'id, account, income, expenses'
指定输出路径、指定数据分隔符
sqoop import --connect jdbc:mysql://192.168.1.10:3306/db --username root --password 123 --table trade_detail --target-dir '/sqoop/td' --fields-terminated-by '\t'
指定Map数量 -m
sqoop import --connect jdbc:mysql://192.168.1.10:3306/db --username root --password 123 --table trade_detail --target-dir '/sqoop/td1' --fields-terminated-by '\t' -m 2
增加where条件, 注意:条件必须用引号引起来
sqoop import --connect jdbc:mysql://192.168.1.10:3306/db --username root --password 123 --table trade_detail --where 'id>3' --target-dir '/sqoop/td2'
增加query语句(使用 \ 将语句换行)
sqoop import --connect jdbc:mysql://192.168.1.10:3306/db --username root --password 123 --query 'SELECT * FROM trade_detail where id > 2 AND $CONDITIONS' --split-by trade_detail.id --target-dir '/sqoop/td3'
注意:如果使用--query这个命令的时候,需要注意的是where后面的参数,AND $CONDITIONS这个参数必须加上
而且存在单引号与双引号的区别,如果--query后面使用的是双引号,那么需要在$CONDITIONS前加上\即\$CONDITIONS
如果设置map数量为1个时即-m 1,不用加上--split-by ${tablename.column},否则需要加上
第二类:
将HDFS上的数据导出到数据库中(不要忘记指定分隔符)
sqoop export --connect jdbc:mysql://192.168.8.120:3306/db --username root --password 123 --export-dir '/td3' --table td_bak -m 1 --fields-terminated-by ','
分享到:
相关推荐
Sqoop 安装与使用 Sqoop 是一款方便的在传统型数据库与 Hadoop 之间进行数据迁移的工具,充分利用 MapReduce 并行特点以批处理的方式加快数据传输。Sqoop 工具是 Hadoop 下连接关系型数据库和 Hadoop 的桥梁,支持...
**一、Sqoop安装** 1. 首先,你需要访问 `/install-package` 目录,确认sqoop的安装包已经在那里。使用命令 `cd /install-package` 和 `ls` 检查。 2. 接下来,解压缩sqoop的安装包到 `/apps` 目录下。运行 `tar -...
根据给定的文件信息,以下是关于大数据教程中Sqoop安装与使用实录的知识点: ### 大数据教程-Sqoop安装与使用实录 #### 1. Sqoop简介 Sqoop是一个开源工具,主要用于在Hadoop与传统数据库(如MySQL、Oracle等)...
包括数据导入,导出,[www.javaxxz.com]1.02_02_01_17 回顾复Sqoop的使用及布置作业(oracle与hadoop数据的import)
在本教程中,我们将详细探讨 Sqoop 的安装过程及其基本使用方法。 ### Sqoop 的安装 1. **环境准备**:确保你已经安装了 Java 运行环境(JRE)和 Java 开发工具(JDK),因为 Sqoop 需要它们。检查 Java 版本: `...
#### 二、Sqoop安装步骤 1. **下载压缩包**: - 访问[Apache官方镜像站点](https://mirrors.tuna.tsinghua.edu.cn/apache/sqoop/1.4.6/),下载`sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz`。 2. **解压并配置...
sqoop安装详解以及sqoop内容介绍使用介绍 集群介绍 sqoop:是一个工具,主要用于导入导出,实现MySQL到Hadoop之间数据的转换 2、导入数据:从结构化数据(Mysql,oracle,db2,)导入到半结构化或非结构化hadoop中...
大数据集群 Hadoop HBase Hive Sqoop 集群环境安装配置及使用文档 在本文档中,我们将详细介绍如何搭建一个大数据集群环境,包括 Hadoop、HBase、Hive 和 Sqoop 的安装配置及使用。该文档将分为四部分:Hadoop 集群...
Sqoop 组件安装配置 Sqoop 是一个开源的数据传输工具,由 Apache 软件基金会开发,主要用于在 Hadoop 和结构化数据存储之间传输大量数据。Sqoop 提供了一种高效、可靠的方式来将数据从关系数据库管理系统(RDBMS)...
Sqoop 的架构部署简单、使用方便,但也存在一些缺点,例如命令行方式容易出错,格式紧耦合,无法支持所有数据类型,安全机制不够完善,例如密码暴漏,安装需要 root 权限,connector 必须符合 JDBC 模型。...
Sqoop 的安装和配置是使用 Sqoop 的前提条件,本文将指导您完成 Sqoop 的安装和配置。 1. 安装 Sqoop Sqoop 的安装非常简单,首先需要下载 Sqoop 的安装包 sqoop-1.2.0-CDH3B4.tar.gz,然后解压缩该文件,将其解...
一旦 Sqoop 安装完毕,你可以开始尝试使用 Sqoop 进行数据导入导出操作,例如从 MySQL 数据库导入数据到 Hadoop 或者反之。 通过这个实验,你不仅掌握了 Sqoop 的安装,还了解了如何配置环境变量和管理文件权限,...
Sqoop 组件安装配置 Sqoop 是一个开源的数据传输工具,用于在 Hadoop 和结构化数据存储之间传输数据。...通过本实验,用户可以掌握 Sqoop 的安装、配置和使用方法,从而提高数据传输效率和可靠性。
本电商数仓项目中的第九部分重点介绍了如何安装和配置Sqoop,这对于构建高效的数据仓库系统至关重要。以下是对 Sqoop 的详细介绍以及安装配置步骤。 一、Sqoop 简介 Sqoop 是一个用来在 Hadoop 和结构化数据存储...
在这个“sqoop安装工具”压缩包中,包含了 Sqoop 的安装包以及 MySQL 的驱动包,这为用户一次性解决安装需求提供了便利。 首先,我们需要理解Sqoop的基本工作原理。Sqoop是通过MapReduce任务来执行数据迁移的,它...
3. 解压后,进入Sqoop的安装目录,执行一系列的目录结构查看和文件查看命令,了解Sqoop的安装目录结构和关键文件。 4. 接下来需要拷贝MySQL JDBC连接驱动到Sqoop的lib目录中。这是必须的步骤,因为Sqoop需要借助...
### Sqoop2安装与配置详解 #### 一、概述 Sqoop是一款开源工具,主要用于在Hadoop和关系型...以上步骤涵盖了Sqoop2的完整安装流程,按照这些步骤操作,可以有效地完成安装并准备好开始使用Sqoop2进行数据迁移任务。
安装 Sqoop 需要先确保已安装 Java 和 Hadoop。在系统环境变量中设置 `HADOOP_HOME`,并添加 Sqoop 的安装路径到 `PATH` 变量。例如: ``` export SQOOP_HOME=/home/hadoop/sqoop-1.2.0 export SQOOP_CONF_DIR=/...
此外,Sqoop还支持多种数据库,如MySQL、Oracle等,不过需要安装相应的JDBC驱动,而驱动的版本需和数据库版本保持一致。例如,对于MySQL数据库,可以将对应的mysql-connector-java驱动包放到指定的Java类路径下。 ...
当Sqoop安装配置完成后,可以通过执行一些基本的命令来测试Sqoop是否安装成功。如使用“sqoop list-databases”命令列出数据库中的所有数据库名,或者使用“sqoop eval”命令来测试数据库连接。 此外,Sqoop的性能...