`

sqoop常用命令

 
阅读更多
sqoop常用命令
2013-12-12 20:08 793人阅读 评论(0) 收藏 举报
目录(?)[+]
1、列出mysql数据库中的所有数据库
sqoop list-databases --connect jdbc:mysql://localhost:3306/ -username dyh -password 000000



2、连接mysql并列出数据库中的表
sqoop list-tables --connect jdbc:mysql://localhost:3306/test --username dyh --password 000000



3、将关系型数据的表结构复制到hive中
sqoop create-hive-table --connect jdbc:mysql://localhost:3306/test --table users --username dyh

--password 000000 --hive-table users  --fields-terminated-by "\0001"  --lines-terminated-by "\n";

参数说明:

--fields-terminated-by "\0001"  是设置每列之间的分隔符,"\0001"是ASCII码中的1,它也是hive的默认行内分隔符, 而sqoop的默认行内分隔符为","

--lines-terminated-by "\n"  设置的是每行之间的分隔符,此处为换行符,也是默认的分隔符;



注意:只是复制表的结构,表中的内容没有复制


4、将数据从关系数据库导入文件到hive表中
sqoop import --connect jdbc:mysql://localhost:3306/test --username dyh --password 000000

--table users --hive-import --hive-table users -m 2 --fields-terminated-by "\0001";

参数说明:

-m 2 表示由两个map作业执行;

--fields-terminated-by "\0001"  需同创建hive表时保持一致;



5、将hive中的表数据导入到mysql数据库表中
sqoop export --connect jdbc:mysql://192.168.20.118:3306/test --username dyh --password 000000

--table users --export-dir /user/hive/warehouse/users/part-m-00000

--input-fields-terminated-by '\0001'


注意:

1、在进行导入之前,mysql中的表userst必须已经提起创建好了。

2、jdbc:mysql://192.168.20.118:3306/test中的IP地址改成localhost会报异常,具体见本人上一篇帖子



6、将数据从关系数据库导入文件到hive表中,--query 语句使用
sqoop import --append --connect jdbc:mysql://192.168.20.118:3306/test --username dyh --password 000000 --query "select id,age,name from userinfos where \$CONDITIONS"  -m 1  --target-dir /user/hive/warehouse/userinfos2 --fields-terminated-by ",";


7、将数据从关系数据库导入文件到hive表中,--columns  --where 语句使用
sqoop import --append --connect jdbc:mysql://192.168.20.118:3306/test --username dyh --password 000000 --table userinfos --columns "id,age,name"  --where "id > 3 and (age = 88 or age = 80)"  -m 1  --target-dir /user/hive/warehouse/userinfos2 --fields-terminated-by ",";

注意:--target-dir /user/hive/warehouse/userinfos2   可以用  --hive-import --hive-table userinfos2 进行替换
分享到:
评论

相关推荐

    sqoop常用命令文件

    以上只是 Sqoop 常用命令的一部分,实际使用中还有更多高级特性和选项,如分区导入、定制 MapReduce 类、使用 Hive 表等。对于 Hadoop 用户来说,熟练掌握 Sqoop 命令是实现数据库与 Hadoop 间高效数据交互的关键。...

    sqoop常用命令.xlsx

    sqoop的常用指令操作

    sqoop常用命令参数-中文1

    在这个场景中,我们将详细探讨 Sqoop 的常用命令参数。 1. **通用参数**: - `--connect`:这是连接关系型数据库的 URL,用于指定要导入或导出数据的数据库地址。 - `--connection-manager`:用于指定使用的连接...

    sqoop 使用手册

    三、Sqoop 常用命令及选项 1. `import` 命令:用于从 RDBMS 导入数据。例如: ``` sqoop import --connect jdbc:mysql://localhost/testdb --table employees --username root --password hadoop --target-dir /...

    hadoop大数据平台技术与应用--第7章数据迁移工具Sqoop.pdf

    ### Sqoop常用命令 Sqoop提供了一系列的命令来支持数据迁移任务,一些常用的命令包括: - import:用于从关系数据库导入数据到HDFS。 - import-all-tables:将指定数据库中的所有表导入到HDFS的独立存储目录。 - ...

    sqoop安装与使用

    ### Sqoop 安装与使用详解 #### 一、Sqoop功能概述 Sqoop是一款用于在Hadoop和关系型...以上介绍了如何安装和使用Sqoop的基本流程及常用命令,通过这些命令可以帮助用户轻松地在Hadoop与关系型数据库之间迁移数据。

    sqoop-javabean-sqoop脚本分隔符失效问题

    1. **命令行参数设置**:确保你在运行Sqoop命令时正确指定了`--fields-terminated-by`选项。例如,如果希望使用逗号(,)作为分隔符,你应该执行`sqoop export --fields-terminated-by ',' ...`。如果这个参数没有被...

    Sqoop用户指南

    - **命令别名**:为常用命令创建别名以简化输入。 - **控制Hadoop安装**:通过环境变量或命令行参数指定不同的Hadoop实例。 - **通用与具体参数**:区分适用于所有命令的通用参数与特定于某个命令的具体参数。 - **...

    【大数据学习资料】大数据常用命令.zip

    本资料包“【大数据学习资料】大数据常用命令.zip”包含了一份Markdown格式的大数据常用命令文档(大数据常用命令.md)和一个PDF版本的相同内容(【大数据学习资料】大数据学习命令.pdf),旨在为学习者提供方便快捷...

    Sqoop同步数据命令

    Sqoop介绍 Sqoop是一个用来将Hadoop和关系型数据库中的数据相互转移的工具,可以使用Sqoop将数据从MySQL或Oracle等关系数据库管理系统(RDBMS)导入Hadoop分布式文件系统(HDFS),在Hadoop MapReduce...常用参数 -co

    Sqoop数据采集工具简介、安装、使用学习笔记(配合Hive和Hbase)

    #### 常用命令示例 - **从 PostgreSQL 导入数据到 Hive**: ```bash sqoop import \ --connect jdbc:postgresql://localhost/test \ --username root \ --password root \ --table test_table \ --hive-...

    第十二节、sqoop的安装与使用.pdf1

    以下是关于Sqoop的安装配置及常用功能的详细说明。 ### 一、功能概述 Sqoop的主要功能在于实现Hadoop生态(如Hive)与MySQL、Oracle等关系数据库之间的数据交换。它可以将关系型数据库的数据批量导入到Hadoop的...

    Hadoop+Hive+Spark+Kafka+Zookeeper+Flume+Sqoop+Azkaban+Scala

    常用 Shell 命令 Java API 的使用 基于 Zookeeper 搭建 Hadoop 高可用集群 二、Hive 简介及核心概念 Linux 环境下 Hive 的安装部署 CLI 和 Beeline 命令行的基本使用 常用 DDL 操作 分区表和分桶表 视图和索引 常用 ...

    大数据之sqoop

    Sqoop是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递,可以将一...本视频从讲解sqoop原理开始,详细讲述了sqoop的安装,使用案例和常用的命令,实现快速上手sqoop的使用

    大数据学习笔记

    四、Sqoop的基本原理和常用命令 Sqoop是一个用于在Hadoop和结构化数据存储之间进行数据传输的工具,提供了高性能的数据传输能力。Sqoop的基本原理是基于Hadoop的MapReduce框架,使用HDFS作为存储层,提供了高性能的...

    大数据学习路线 大数据技术栈思维导图 大数据常用软件安装指南

    HDFS 常用 Shell 命令 HDFS Java API 的使用 基于 Zookeeper 搭建 Hadoop 高可用集群 Hive Hive 简介及核心概念 Linux 环境下 Hive 的安装部署 Hive CLI 和 Beeline 命令行的基本使用 Hive 常用 DDL 操作 Hive 分区...

    第13章 大数据平台监控命令.docx

    这可能包括查看节点状态、进程状态等,常用的命令有`jps`来查看Java进程,或者使用`netstat`检查网络连接情况。 - **任务二**:通过命令查看Hadoop状态。这可能涉及到检查Hadoop的NameNode、DataNode、JobHistory...

    Ubuntu安装MySQL及常用操作

    ### Ubuntu安装MySQL及常用操作详解 #### 一、安装MySQL ...以上介绍了在Ubuntu系统上安装MySQL的方法以及一些常用的MySQL操作命令。通过这些命令,你可以轻松地管理数据库和表,执行数据的增删改查等基本操作。

Global site tag (gtag.js) - Google Analytics