1、启动、停止 Sqoop 2 server:
bin/sqoop.sh server start
验证地址:http://node3:12000/sqoop/
bin/sqoop.sh server stop
2、sqoop2 命令行
bin/sqoop.sh client
输入help 查看命令
exit (\x ) Exit the shell
history (\H ) Display, manage and recall edit-line history
help (\h ) Display this help message
set (\st ) Configure various client options and settings
show (\sh ) Display various objects and configuration options
create (\cr ) Create new object in Sqoop repository
delete (\d ) Delete existing object in Sqoop repository
update (\up ) Update objects in Sqoop repository
clone (\cl ) Create new object based on existing one
start (\sta) Start job
stop (\stp) Stop job
status (\stu) Display status of a job
enable (\en ) Enable object in Sqoop repository
disable (\di ) Disable object in Sqoop repository
3、设置sqoop server:
set server --host node3 --port 12000 --webapp sqoop
Set Option 使用
verbose 客户端输出更多的日志
poll-timeout 10000 Server poll timeout in milliseconds
Example:
set option --name verbose --value true
set option --name poll-timeout --value 20000
查询已有连接
show connector
查询link
show link
查询job
show job
创建link
create link --cid 1 or create link -c 1 "1" 为connector id
创建 job
create job --from 1 --to 2 or create job --f 1 --t 2 "-f 或-- from" 为从link1 "-t 或 --to" 到 link2
更新 link
update link -l1 "-l1" 是linkid为1的
更新job
update job -j1 "-j1" 是jobid为1的
启动一个job
Argument Description
-j, --jid <x> Start job with id <x>
-s, --synchronous Synchoronous job execution
Example:
start job --jid 1
start job --jid 1 --synchronous
Stop job
-j, --jid <x> Interrupt running job with id <x>
Example:
stop job --jid 1
clone job|link
克隆时名称要修改
4 实例
实例:建立一个hdfslink
create link -c 3
Name: hdfs_link
HDFS URI: hdfs://ns1/
link was successfully created with status OK
实例:建立一个JDBC link
create link -c 4
Name: oracleJdbc_link
JDBC Driver Class: oracle.jdbc.driver.OracleDriver
JDBC Connection String: jdbc:oracle:thin:@hostip:1521:erpdb
Username: jlerp_v
Password: xxxxxx
JDBC Connection Properties:
There are currently 0 values in the map:
entry#
link was successfully created with status OK
实例 克隆oracleJdbc_link
sqoop:000> clone link -lid 5
Cloning link with id 5
Please update link:
Name: oracleJdbc_link_clone
Link configuration
JDBC Driver Class: oracle.jdbc.driver.OracleDriver
JDBC Connection String: jdbc:oracle:thin:@10.68.2.23:1521:erpdb
Username: jlerp_v
Password: *******
JDBC Connection Properties:
There are currently 0 values in the map:
entry#
link was successfully created with validation status WARNING and persistent id 8
注意 在创建JDBCjob时
Schema name: Table name: 配对使用,如果输入了schema 和 table name ,Table SQL statement: 就不需要输入,如果输入了 sql语句就不填 schema 和 table name
分享到:
相关推荐
6. **测试连接**:使用Sqoop2 Client进行连接测试,确认服务正常工作。在命令行输入`bin/sqoop list-databases --connect jdbc:mysql://localhost/`(假设你有一个本地运行的MySQL服务器),如果一切正常,应该能...
### Sqoop2安装与配置详解 #### 一、概述 Sqoop是一款开源工具,主要用于在Hadoop和关系型...以上步骤涵盖了Sqoop2的完整安装流程,按照这些步骤操作,可以有效地完成安装并准备好开始使用Sqoop2进行数据迁移任务。
### Sqoop 的简单使用 #### 导入数据 1. **连接信息**:首先,你需要提供数据库的连接信息,如主机名、端口、数据库名、用户名和密码: ```bash sqoop import --connect 'jdbc:mysql://localhost/yourdb' \ --...
### Sqoop2-1.99.7 文档概述 #### 一、Sqoop简介 Apache Sqoop 是一个工具,用于高效地在结构化、半结构化和非结构化数据源之间传输数据。例如,关系型数据库是具有明确数据模式的结构化数据源的示例;Cassandra ...
本主题将深入探讨如何将Hadoop与Hive和Sqoop这两个重要工具结合使用,以实现高效的数据管理和数据迁移。 首先,我们来看Hadoop。Hadoop基于Google的GFS(Google File System)和MapReduce模型设计,它提供了海量...
2. 并发特性和容错:Sqoop 的架构非常简单,整合了 Hive、Hbase 和 Oozie,通过 map-reduce 任务来传输数据,从而提供并发特性和容错。 3. 实用的小工具:Sqoop 提供了一些诸如查看数据库表等实用的小工具。 六、...
1. Sqoop2:提供了更强大的管理和监控功能,支持多用户同时操作。 2. Sqoop-Connector:允许与其他数据存储系统(如 NoSQL 数据库)进行交互。 3. 集成工具:可以与 Hive、Pig、HBase 等 Hadoop 生态系统的其他...
Sqoop 提供了命令行界面,用户可以通过简单的命令来执行数据导入导出操作。基本命令格式为 `sqoop [command] [options]`。 #### 6. Sqoop 工具 ##### 6.1 使用命令别名 为了简化命令行输入,Sqoop 提供了一些命令...
需要注意的是,Sqoop2并不与Sqoop1兼容,且功能不全,不推荐用于生产环境,最新的Sqoop1版本是1.99.7。 **2. Sqoop原理** Sqoop的工作方式是将导入或导出命令转化为MapReduce程序执行。在生成的MapReduce程序中,...
Sqoop 是一款用于批量迁移结构化数据到 Hadoop 生态系统中的工具,它使得 SQL 数据库与 Hadoop 之间的数据交换变得简单。通过使用 MapReduce,Sqoop 可以并行处理大量数据,从而实现快速的数据导入导出。此外,它还...
相比之下,Sqoop2 引入了更多交互方式,如Web UI、REST API,实现了连接器的集中管理,有更完善的权限控制,但其架构较为复杂,配置和部署过程比 Sqoop1 更繁琐。 在功能方面,Sqoop1 支持与大多数主要的 RDBMS ...
2. **数据导出**: Sqoop同样支持将HDFS中的数据导出到RDBMS,这在需要将处理结果反馈到传统业务系统时非常有用。 3. **增量导入**: Sqoop支持两种增量导入方式——基于时间戳和基于标识符。前者根据数据库中的...
2. **Java Bean映射**:在使用Sqoop生成Java Beans时,你需要确保Java Bean的属性与数据库表的列名相对应。如果 Sqoop无法正确匹配列名和Bean的属性,可能会导致分隔符失效的问题。检查Bean的属性命名是否符合Sqoop...
2. **简单验证**: 在实际操作前,我们需要验证 Sqoop 是否能成功连接到数据库。可以使用 `list-databases` 命令来列出数据库中的所有库。 ```bash sqoop list-databases --connect jdbc:mysql://<hostname>:...
本文将详细介绍如何在Hadoop2.6伪分布环境中安装配置Sqoop1.4.6,并进行简单的测试,包括启动Sqoop、MySQL服务以及如何实现从MySQL导入数据到HDFS和从HDFS导出数据到MySQL。 #### 安装环境准备 在开始之前,请确保...
4. **基本操作**:使用 Sqoop,用户可以通过简单的命令行接口执行以下操作: - `import`:将数据库表或查询结果导入 HDFS。 - `export`:将 HDFS 中的数据导出到数据库表。 - `create-table`:在数据库中创建表...
Sqoop 1.4.4是针对Hadoop 2.x系列的一个稳定版本,这意味着它已经过广泛的测试,可以很好地与这个Hadoop版本家族的其他组件(如HDFS、MapReduce等)协同工作。 在压缩包文件名“sqoop-1.4.4.bin__hadoop-2.0.4-...
9. **命令行界面**:用户可以通过简单的命令行界面与 Sqoop 交互,也可以通过编程接口(API)集成到自动化工作流程中。 10. **版本兼容性**: Sqoop 1.4.5 版本兼容多个版本的 Hadoop,确保在不同环境下都能正常...
2. **配置文件**:修改 `$SQOOP_HOME/conf/sqoop-env.sh` 文件,设置数据库驱动相关的 JAR 文件路径,例如将 MySQL 驱动 JAR 放入 `$SQOOP_HOME/lib` 目录。 3. **数据导入**:使用 `sqoop import` 命令进行数据导入...
本文档不仅提供了基本命令的使用方法,还深入探讨了各命令的具体应用场景,帮助用户更好地理解和运用Sqoop。 #### 命令详解 ##### 1. codegen - **功能**:将关系数据库表映射为Java文件、Java类及相关的jar包。...