sqoop常用命令
2013-12-12 20:08 793人阅读 评论(0) 收藏 举报
目录(?)[+]
1、列出mysql数据库中的所有数据库
sqoop list-databases --connect jdbc:mysql://localhost:3306/ -username dyh -password 000000
2、连接mysql并列出数据库中的表
sqoop list-tables --connect jdbc:mysql://localhost:3306/test --username dyh --password 000000
3、将关系型数据的表结构复制到hive中
sqoop create-hive-table --connect jdbc:mysql://localhost:3306/test --table users --username dyh
--password 000000 --hive-table users --fields-terminated-by "\0001" --lines-terminated-by "\n";
参数说明:
--fields-terminated-by "\0001" 是设置每列之间的分隔符,"\0001"是ASCII码中的1,它也是hive的默认行内分隔符, 而sqoop的默认行内分隔符为","
--lines-terminated-by "\n" 设置的是每行之间的分隔符,此处为换行符,也是默认的分隔符;
注意:只是复制表的结构,表中的内容没有复制
4、将数据从关系数据库导入文件到hive表中
sqoop import --connect jdbc:mysql://localhost:3306/test --username dyh --password 000000
--table users --hive-import --hive-table users -m 2 --fields-terminated-by "\0001";
参数说明:
-m 2 表示由两个map作业执行;
--fields-terminated-by "\0001" 需同创建hive表时保持一致;
5、将hive中的表数据导入到mysql数据库表中
sqoop export --connect jdbc:mysql://192.168.20.118:3306/test --username dyh --password 000000
--table users --export-dir /user/hive/warehouse/users/part-m-00000
--input-fields-terminated-by '\0001'
注意:
1、在进行导入之前,mysql中的表userst必须已经提起创建好了。
2、jdbc:mysql://192.168.20.118:3306/test中的IP地址改成localhost会报异常,具体见本人上一篇帖子
6、将数据从关系数据库导入文件到hive表中,--query 语句使用
sqoop import --append --connect jdbc:mysql://192.168.20.118:3306/test --username dyh --password 000000 --query "select id,age,name from userinfos where \$CONDITIONS" -m 1 --target-dir /user/hive/warehouse/userinfos2 --fields-terminated-by ",";
7、将数据从关系数据库导入文件到hive表中,--columns --where 语句使用
sqoop import --append --connect jdbc:mysql://192.168.20.118:3306/test --username dyh --password 000000 --table userinfos --columns "id,age,name" --where "id > 3 and (age = 88 or age = 80)" -m 1 --target-dir /user/hive/warehouse/userinfos2 --fields-terminated-by ",";
注意:--target-dir /user/hive/warehouse/userinfos2 可以用 --hive-import --hive-table userinfos2 进行替换
分享到:
相关推荐
以上只是 Sqoop 常用命令的一部分,实际使用中还有更多高级特性和选项,如分区导入、定制 MapReduce 类、使用 Hive 表等。对于 Hadoop 用户来说,熟练掌握 Sqoop 命令是实现数据库与 Hadoop 间高效数据交互的关键。...
sqoop的常用指令操作
在这个场景中,我们将详细探讨 Sqoop 的常用命令参数。 1. **通用参数**: - `--connect`:这是连接关系型数据库的 URL,用于指定要导入或导出数据的数据库地址。 - `--connection-manager`:用于指定使用的连接...
三、Sqoop 常用命令及选项 1. `import` 命令:用于从 RDBMS 导入数据。例如: ``` sqoop import --connect jdbc:mysql://localhost/testdb --table employees --username root --password hadoop --target-dir /...
### Sqoop常用命令 Sqoop提供了一系列的命令来支持数据迁移任务,一些常用的命令包括: - import:用于从关系数据库导入数据到HDFS。 - import-all-tables:将指定数据库中的所有表导入到HDFS的独立存储目录。 - ...
1. **命令行参数设置**:确保你在运行Sqoop命令时正确指定了`--fields-terminated-by`选项。例如,如果希望使用逗号(,)作为分隔符,你应该执行`sqoop export --fields-terminated-by ',' ...`。如果这个参数没有被...
- **命令别名**:为常用命令创建别名以简化输入。 - **控制Hadoop安装**:通过环境变量或命令行参数指定不同的Hadoop实例。 - **通用与具体参数**:区分适用于所有命令的通用参数与特定于某个命令的具体参数。 - **...
### Sqoop 安装与使用详解 #### 一、Sqoop功能概述 Sqoop是一款用于在Hadoop和关系型...以上介绍了如何安装和使用Sqoop的基本流程及常用命令,通过这些命令可以帮助用户轻松地在Hadoop与关系型数据库之间迁移数据。
本资料包“【大数据学习资料】大数据常用命令.zip”包含了一份Markdown格式的大数据常用命令文档(大数据常用命令.md)和一个PDF版本的相同内容(【大数据学习资料】大数据学习命令.pdf),旨在为学习者提供方便快捷...
Sqoop介绍 Sqoop是一个用来将Hadoop和关系型数据库中的数据相互转移的工具,可以使用Sqoop将数据从MySQL或Oracle等关系数据库管理系统(RDBMS)导入Hadoop分布式文件系统(HDFS),在Hadoop MapReduce...常用参数 -co
#### 常用命令示例 - **从 PostgreSQL 导入数据到 Hive**: ```bash sqoop import \ --connect jdbc:postgresql://localhost/test \ --username root \ --password root \ --table test_table \ --hive-...
以下是关于Sqoop的安装配置及常用功能的详细说明。 ### 一、功能概述 Sqoop的主要功能在于实现Hadoop生态(如Hive)与MySQL、Oracle等关系数据库之间的数据交换。它可以将关系型数据库的数据批量导入到Hadoop的...
常用 Shell 命令 Java API 的使用 基于 Zookeeper 搭建 Hadoop 高可用集群 二、Hive 简介及核心概念 Linux 环境下 Hive 的安装部署 CLI 和 Beeline 命令行的基本使用 常用 DDL 操作 分区表和分桶表 视图和索引 常用 ...
Sqoop是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递,可以将一...本视频从讲解sqoop原理开始,详细讲述了sqoop的安装,使用案例和常用的命令,实现快速上手sqoop的使用
四、Sqoop的基本原理和常用命令 Sqoop是一个用于在Hadoop和结构化数据存储之间进行数据传输的工具,提供了高性能的数据传输能力。Sqoop的基本原理是基于Hadoop的MapReduce框架,使用HDFS作为存储层,提供了高性能的...
HDFS 常用 Shell 命令 HDFS Java API 的使用 基于 Zookeeper 搭建 Hadoop 高可用集群 Hive Hive 简介及核心概念 Linux 环境下 Hive 的安装部署 Hive CLI 和 Beeline 命令行的基本使用 Hive 常用 DDL 操作 Hive 分区...
这可能包括查看节点状态、进程状态等,常用的命令有`jps`来查看Java进程,或者使用`netstat`检查网络连接情况。 - **任务二**:通过命令查看Hadoop状态。这可能涉及到检查Hadoop的NameNode、DataNode、JobHistory...
### Ubuntu安装MySQL及常用操作详解 #### 一、安装MySQL ...以上介绍了在Ubuntu系统上安装MySQL的方法以及一些常用的MySQL操作命令。通过这些命令,你可以轻松地管理数据库和表,执行数据的增删改查等基本操作。